1.一種音頻分類方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述特征提取參數(shù)包括深度卷積參數(shù)和逐點卷積參數(shù),所述基于特征提取參數(shù),確定每個所述分段音頻對應的分段音頻特征,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)多個分類維度對應的維度參數(shù)以及每個所述分段音頻特征,預測每個所述分段音頻在每個所述分類維度下的多個預測概率,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述針對每個所述分類維度,利用每個所述分段音頻在所述分類維度對應的預設(shè)類型下的預測概率,確定每個分類維度對應的目標類型,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從待分類音頻中提取至少一個分段音頻,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述待使用樣本音頻的預測類型,以及所述待使用樣本音頻對應的樣本類型,調(diào)整所述初始特征提取參數(shù)和所述初始維度參數(shù),得到特征提取參數(shù)和維度參數(shù),包括:
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述獲取訓練樣本集,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述多媒體信息包括多媒體內(nèi)容和多媒體描述信息,所述根據(jù)預設(shè)多媒體對應的多媒體信息,獲取初始樣本音頻,包括:
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述在時域上對所述初始樣本音頻進行增強處理,得到時域增強樣本音頻,包括:
11.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述在頻域上對所述初始樣本音頻進行增強處理,得到頻域增強樣本音頻,包括:
12.一種音頻分類裝置,其特征在于,所述裝置包括:
13.一種電子設(shè)備,其特征在于,包括處理器和存儲器,所述存儲器存儲有多條指令;所述處理器從所述存儲器中加載指令,以執(zhí)行如權(quán)利要求1~11任一項所述的音頻分類方法中的步驟。
14.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有多條指令,所述指令適于處理器進行加載,以執(zhí)行權(quán)利要求1~11任一項所述的音頻分類方法中的步驟。
15.一種計算機程序產(chǎn)品,其特征在于,包括計算機程序/指令,所述計算機程序/指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1~11任一項所述的音頻分類方法中的步驟。