音頻分類方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品與流程

文檔序號：41956644發(fā)布日期：2025-05-20 16:50閱讀：來源：國知局

技術(shù)特征：

1.一種音頻分類方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述特征提取參數(shù)包括深度卷積參數(shù)和逐點卷積參數(shù)，所述基于特征提取參數(shù)，確定每個所述分段音頻對應的分段音頻特征，包括：

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)多個分類維度對應的維度參數(shù)以及每個所述分段音頻特征，預測每個所述分段音頻在每個所述分類維度下的多個預測概率，包括：

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述針對每個所述分類維度，利用每個所述分段音頻在所述分類維度對應的預設(shè)類型下的預測概率，確定每個分類維度對應的目標類型，包括：

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述從待分類音頻中提取至少一個分段音頻，包括：

6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述根據(jù)所述待使用樣本音頻的預測類型，以及所述待使用樣本音頻對應的樣本類型，調(diào)整所述初始特征提取參數(shù)和所述初始維度參數(shù)，得到特征提取參數(shù)和維度參數(shù)，包括：

8.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述獲取訓練樣本集，包括：

9.根據(jù)權(quán)利要求8所述的方法，其特征在于，所述多媒體信息包括多媒體內(nèi)容和多媒體描述信息，所述根據(jù)預設(shè)多媒體對應的多媒體信息，獲取初始樣本音頻，包括：

10.根據(jù)權(quán)利要求8所述的方法，其特征在于，所述在時域上對所述初始樣本音頻進行增強處理，得到時域增強樣本音頻，包括：

11.根據(jù)權(quán)利要求8所述的方法，其特征在于，所述在頻域上對所述初始樣本音頻進行增強處理，得到頻域增強樣本音頻，包括：

12.一種音頻分類裝置，其特征在于，所述裝置包括：

13.一種電子設(shè)備，其特征在于，包括處理器和存儲器，所述存儲器存儲有多條指令；所述處理器從所述存儲器中加載指令，以執(zhí)行如權(quán)利要求1～11任一項所述的音頻分類方法中的步驟。

14.一種計算機可讀存儲介質(zhì)，其特征在于，所述計算機可讀存儲介質(zhì)存儲有多條指令，所述指令適于處理器進行加載，以執(zhí)行權(quán)利要求1～11任一項所述的音頻分類方法中的步驟。

15.一種計算機程序產(chǎn)品，其特征在于，包括計算機程序/指令，所述計算機程序/指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1～11任一項所述的音頻分類方法中的步驟。

技術(shù)總結(jié)
本申請實施例公開了一種音頻分類方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品；本申請可以從待分類音頻中提取至少一個分段音頻；根據(jù)多個分類維度對應的維度參數(shù)以及每個分段音頻特征，預測每個分段音頻在每個分類維度下的多個預測概率；針對每個分類維度，利用每個分段音頻在分類維度對應的預設(shè)類型下的預測概率，確定每個分類維度對應的目標類型；根據(jù)目標類型，確定待分類音頻的分類結(jié)果。基于相同的特征提取參數(shù)對分段音頻進行特征提取，再利用不同的維度參數(shù)計算預測概率，可實現(xiàn)一次推理即可確定出待分類音頻的在多個分類維度下的目標類型，避免重復推理，以降低分類的數(shù)據(jù)處理量，進而提升了音頻分類的效率。

技術(shù)研發(fā)人員：許靳昌
受保護的技術(shù)使用者：騰訊科技（深圳）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/19

完整全部詳細技術(shù)資料下載

當前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

音頻分類方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品與流程

音頻分類方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品與流程