基于雙重對抗學(xué)習(xí)的語音情感識別方法及識別系統(tǒng)

文檔序號：41944910發(fā)布日期：2025-05-16 14:02閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>基于雙重對抗學(xué)習(xí)的語音情感識別方法及識別系統(tǒng)

技術(shù)特征：

1.一種基于雙重對抗學(xué)習(xí)的語音情感識別方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法，其特征在于，獲取語音信號并進行預(yù)處理，使用情感分類器中的wavlm預(yù)訓(xùn)練模型從預(yù)處理后的語音信號中提取wavlm特征，具體為：

3.根據(jù)權(quán)利要求1所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法，其特征在于，所述情感分類器由wavlm預(yù)訓(xùn)練模型、情感編碼器、全連接層及softmax分類層組成；

4.根據(jù)權(quán)利要求3所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法，其特征在于，所述對抗音素分類器，具體為：

5.根據(jù)權(quán)利要求3所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法，其特征在于，基于對抗音素分類器通過共享特征配置情感分類器及對抗說話人分類器的參數(shù)，采用帶標(biāo)注的語音信號對應(yīng)的wavlm特征對所述對抗音素分類器、情感分類器及對抗說話人分類器同時進行有監(jiān)督訓(xùn)練；

6.根據(jù)權(quán)利要求3所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法，其特征在于，分別計算情感分類器、對抗因素分類器及對抗說話人分類器的交叉熵損失，具體為：

7.根據(jù)權(quán)利要求1所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法，其特征在于，獲取預(yù)處理后的待識別語音信號，將所述待識別語音信號分別導(dǎo)入訓(xùn)練好的情感分類器、對抗音素分類器和對抗說話人分類器；

8.一種基于雙重對抗學(xué)習(xí)的語音情感識別系統(tǒng)，其特征在于，實現(xiàn)如權(quán)利要求1-7任一項所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法，該系統(tǒng)包括：語音信號輸入模塊、情感分類器模塊、對抗音素分類器模塊、對抗說話人分類器模塊、分類器訓(xùn)練模塊及語音情感輸出模塊；

技術(shù)總結(jié)
本發(fā)明公開了一種基于雙重對抗學(xué)習(xí)的語音情感識別方法及識別系統(tǒng)，涉及語音信號處理技術(shù)領(lǐng)域，包括：獲取語音信號并進行預(yù)處理，使用情感分類器中的WavLM預(yù)訓(xùn)練模型從預(yù)處理后的語音信號中提取WavLM特征；將提取的WavLM特征分別送入情感編碼器、對抗音素分類器和對抗說話人分類器，通過雙重對抗學(xué)習(xí)去除待識別語音信號中的說話人信息及內(nèi)容信息，通過情感分類器獲取待識別語音信號的情感類別。本發(fā)明通過對說話人分類器和音素分類器分別進行對抗學(xué)習(xí)，去除語音信號中的說話人信息和內(nèi)容信息，從而提取只包含情感信息的特征用于語音情感識別，有效的提高了語音情感識別的準確率。

技術(shù)研發(fā)人員：黃鍇,曾碧卿,楊繼臣
受保護的技術(shù)使用者：華南師范大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/15

完整全部詳細技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

基于雙重對抗學(xué)習(xí)的語音情感識別方法及識別系統(tǒng)