1.一種基于雙重對抗學(xué)習(xí)的語音情感識別方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法,其特征在于,獲取語音信號并進行預(yù)處理,使用情感分類器中的wavlm預(yù)訓(xùn)練模型從預(yù)處理后的語音信號中提取wavlm特征,具體為:
3.根據(jù)權(quán)利要求1所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法,其特征在于,所述情感分類器由wavlm預(yù)訓(xùn)練模型、情感編碼器、全連接層及softmax分類層組成;
4.根據(jù)權(quán)利要求3所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法,其特征在于,所述對抗音素分類器,具體為:
5.根據(jù)權(quán)利要求3所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法,其特征在于,基于對抗音素分類器通過共享特征配置情感分類器及對抗說話人分類器的參數(shù),采用帶標(biāo)注的語音信號對應(yīng)的wavlm特征對所述對抗音素分類器、情感分類器及對抗說話人分類器同時進行有監(jiān)督訓(xùn)練;
6.根據(jù)權(quán)利要求3所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法,其特征在于,分別計算情感分類器、對抗因素分類器及對抗說話人分類器的交叉熵損失,具體為:
7.根據(jù)權(quán)利要求1所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法,其特征在于,獲取預(yù)處理后的待識別語音信號,將所述待識別語音信號分別導(dǎo)入訓(xùn)練好的情感分類器、對抗音素分類器和對抗說話人分類器;
8.一種基于雙重對抗學(xué)習(xí)的語音情感識別系統(tǒng),其特征在于,實現(xiàn)如權(quán)利要求1-7任一項所述的基于雙重對抗學(xué)習(xí)的語音情感識別方法,該系統(tǒng)包括:語音信號輸入模塊、情感分類器模塊、對抗音素分類器模塊、對抗說話人分類器模塊、分類器訓(xùn)練模塊及語音情感輸出模塊;