技術(shù)總結(jié)
本發(fā)明公開了一種音頻數(shù)據(jù)自動增益控制方法與裝置,其中方法包括:對音頻數(shù)據(jù)進行分幀處理,并提取各幀數(shù)據(jù)的特征參數(shù);根據(jù)當前幀數(shù)據(jù)的特征參數(shù)與語音類別高斯混合模型得到當前幀數(shù)據(jù)的語音類條件概率;根據(jù)當前幀數(shù)據(jù)的特征參數(shù)與噪聲類別高斯混合模型得到當前幀數(shù)據(jù)的噪聲類條件概率,并計算所述當前幀數(shù)據(jù)屬于語音幀的概率以及屬于噪聲幀的概率;當屬于語音幀的概率大于屬于噪聲幀的概率時,將當前幀音頻數(shù)據(jù)判定為語音幀,按照語音幀增益控制規(guī)則控制其增益;反之,將當前幀數(shù)據(jù)判定為噪聲幀,按照噪聲幀增益控制規(guī)則控制其增益。本發(fā)明技術(shù)方案極大地提高了語音與噪聲的識別水平,并依此進行自動增益控制,有效改善了使用者的體驗。
技術(shù)研發(fā)人員:雷延強;程雪峰
受保護的技術(shù)使用者:廣州視源電子科技股份有限公司
文檔號碼:201611169178
技術(shù)研發(fā)日:2016.12.16
技術(shù)公布日:2017.05.10