最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

音頻分類方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品與流程

文檔序號:41956644發(fā)布日期:2025-05-20 16:50閱讀:來源:國知局

技術(shù)特征:

1.一種音頻分類方法,其特征在于,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述特征提取參數(shù)包括深度卷積參數(shù)和逐點卷積參數(shù),所述基于特征提取參數(shù),確定每個所述分段音頻對應的分段音頻特征,包括:

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)多個分類維度對應的維度參數(shù)以及每個所述分段音頻特征,預測每個所述分段音頻在每個所述分類維度下的多個預測概率,包括:

4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述針對每個所述分類維度,利用每個所述分段音頻在所述分類維度對應的預設(shè)類型下的預測概率,確定每個分類維度對應的目標類型,包括:

5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從待分類音頻中提取至少一個分段音頻,包括:

6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述待使用樣本音頻的預測類型,以及所述待使用樣本音頻對應的樣本類型,調(diào)整所述初始特征提取參數(shù)和所述初始維度參數(shù),得到特征提取參數(shù)和維度參數(shù),包括:

8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述獲取訓練樣本集,包括:

9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述多媒體信息包括多媒體內(nèi)容和多媒體描述信息,所述根據(jù)預設(shè)多媒體對應的多媒體信息,獲取初始樣本音頻,包括:

10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述在時域上對所述初始樣本音頻進行增強處理,得到時域增強樣本音頻,包括:

11.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述在頻域上對所述初始樣本音頻進行增強處理,得到頻域增強樣本音頻,包括:

12.一種音頻分類裝置,其特征在于,所述裝置包括:

13.一種電子設(shè)備,其特征在于,包括處理器和存儲器,所述存儲器存儲有多條指令;所述處理器從所述存儲器中加載指令,以執(zhí)行如權(quán)利要求1~11任一項所述的音頻分類方法中的步驟。

14.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有多條指令,所述指令適于處理器進行加載,以執(zhí)行權(quán)利要求1~11任一項所述的音頻分類方法中的步驟。

15.一種計算機程序產(chǎn)品,其特征在于,包括計算機程序/指令,所述計算機程序/指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1~11任一項所述的音頻分類方法中的步驟。


技術(shù)總結(jié)
本申請實施例公開了一種音頻分類方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品;本申請可以從待分類音頻中提取至少一個分段音頻;根據(jù)多個分類維度對應的維度參數(shù)以及每個分段音頻特征,預測每個分段音頻在每個分類維度下的多個預測概率;針對每個分類維度,利用每個分段音頻在分類維度對應的預設(shè)類型下的預測概率,確定每個分類維度對應的目標類型;根據(jù)目標類型,確定待分類音頻的分類結(jié)果。基于相同的特征提取參數(shù)對分段音頻進行特征提取,再利用不同的維度參數(shù)計算預測概率,可實現(xiàn)一次推理即可確定出待分類音頻的在多個分類維度下的目標類型,避免重復推理,以降低分類的數(shù)據(jù)處理量,進而提升了音頻分類的效率。

技術(shù)研發(fā)人員:許靳昌
受保護的技術(shù)使用者:騰訊科技(深圳)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/19
當前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1