語音識別方法、裝置、介質(zhì)及設(shè)備與流程

文檔序號：41949110發(fā)布日期：2025-05-16 14:06閱讀：11來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本申請涉及音頻處理，尤其涉及一種語音識別，特別涉及一種語音識別方法、裝置、介質(zhì)及設(shè)備。

背景技術(shù)：

1、隨著智能家居和語音控制技術(shù)的發(fā)展，目前市場上的大多數(shù)音頻設(shè)備具備語音控制功能。如通過在電視機上集成語音識別功能模塊，能夠讓用戶使用語音指令來控制電視機進行音量調(diào)節(jié)等操作。然而，現(xiàn)有的語音識別技術(shù)在實際應(yīng)用中面臨著一些挑戰(zhàn)。例如，當(dāng)音頻采集裝置(如麥克風(fēng))采集到的音頻數(shù)據(jù)混合了用戶發(fā)出的語音以及音頻設(shè)備當(dāng)前輸出的音頻時，將可能降低對用戶發(fā)出的語音的識別準(zhǔn)確度。

2、為了解決上述問題，現(xiàn)有技術(shù)中通常采用降噪算法，如“倒譜均值減”對音頻采集裝置采集到的音頻數(shù)據(jù)進行減噪處理，以減少干擾因素對識別用戶意圖時造成的影響。但是常見的降噪算法要么會導(dǎo)致用戶發(fā)出的語音經(jīng)處理后出現(xiàn)失真，導(dǎo)致用戶意圖的識別準(zhǔn)確度下降；要么只能針對持續(xù)時長較短的噪音進行消除，當(dāng)針對長時間持續(xù)的噪聲，如音頻設(shè)備當(dāng)前輸出的音頻時，使用常規(guī)的降噪方式所達到的降噪效果并不理想。

技術(shù)實現(xiàn)思路

1、本申請實施例提供一種語音識別方法、裝置、介質(zhì)及設(shè)備。利用本申請實施例提供的語音識別方法，以提升對用戶意圖的識別準(zhǔn)確度。

2、本申請實施例一方面提供了一種語音識別方法，所述方法包括：

3、獲取對應(yīng)同一時刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù)，其中，所述第一音頻數(shù)據(jù)包含用戶語音數(shù)據(jù)及通過音頻輸出裝置輸出、并由外部音頻采集裝置采集得到的第一設(shè)備輸出音頻數(shù)據(jù)，所述第二音頻數(shù)據(jù)為送往所述音頻輸出裝置待輸出的第二設(shè)備輸出音頻數(shù)據(jù)；

4、根據(jù)所述第一音頻數(shù)據(jù)及所述第二音頻數(shù)據(jù)，對所述第一音頻數(shù)據(jù)進行降噪處理，以去除所述第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù)，得到所述用戶語音數(shù)據(jù)；

5、對所述用戶語音數(shù)據(jù)進行語音識別操作，得到與所述用戶語音數(shù)據(jù)對應(yīng)的語音控制指令。

6、相應(yīng)的，本申請實施例另一方面還提供了一種語音識別裝置，所述語音識別裝置包括：

7、數(shù)據(jù)獲取模塊，用于獲取對應(yīng)同一時刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù)，其中，所述第一音頻數(shù)據(jù)包含用戶語音數(shù)據(jù)及通過音頻輸出裝置輸出、并由外部音頻采集裝置采集得到的第一設(shè)備輸出音頻數(shù)據(jù)，所述第二音頻數(shù)據(jù)為送往所述音頻輸出裝置待輸出的第二設(shè)備輸出音頻數(shù)據(jù)；

8、降噪處理模塊，用于根據(jù)所述第一音頻數(shù)據(jù)及所述第二音頻數(shù)據(jù)，對所述第一音頻數(shù)據(jù)進行降噪處理，以去除所述第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù)，得到所述用戶語音數(shù)據(jù)；

9、指令識別模塊，用于對所述用戶語音數(shù)據(jù)進行語音識別操作，得到與所述用戶語音數(shù)據(jù)對應(yīng)的語音控制指令。

10、相應(yīng)的，本申請實施例另一方面還提供了一種計算機存儲介質(zhì)，所述計算機存儲介質(zhì)存儲有多條指令，所述指令適于處理器進行加載，以執(zhí)行如上所述的語音識別方法。

11、相應(yīng)的，本申請實施例另一方面還提供了一種電子設(shè)備，包括處理器和存儲器，所述存儲器存儲有多條指令，所述處理器加載所述指令以執(zhí)行如上所述的語音識別方法。

12、本申請實施例提供了一種語音識別方法、裝置、介質(zhì)及設(shè)備，該方法通過獲取對應(yīng)同一時刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù)，其中，第一音頻數(shù)據(jù)包含用戶語音數(shù)據(jù)及通過音頻輸出裝置輸出、并由外部音頻采集裝置采集得到的第一設(shè)備輸出音頻數(shù)據(jù)，第二音頻數(shù)據(jù)為送往音頻輸出裝置待輸出的第二設(shè)備輸出音頻數(shù)據(jù)；根據(jù)第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù)，對第一音頻數(shù)據(jù)進行降噪處理，以去除第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù)，得到用戶語音數(shù)據(jù)；對用戶語音數(shù)據(jù)進行語音識別操作，得到與用戶語音數(shù)據(jù)對應(yīng)的語音控制指令。利用本申請實施例提供的語音識別方法，通過獲取對應(yīng)同一時刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù)，并基于第二音頻數(shù)據(jù)對第一音頻數(shù)據(jù)進行降噪處理，以去除第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù)，從而得到用于語音識別操作的用戶語音數(shù)據(jù)，根據(jù)得到的用戶語音數(shù)據(jù)能夠提升對用戶意圖的識別準(zhǔn)確度。

技術(shù)特征：

1.一種語音識別方法，其特征在于，包括：

2.如權(quán)利要求1所述的語音識別方法，其特征在于，在所述對所述第一音頻數(shù)據(jù)進行降噪處理之前，所述方法還包括：

3.如權(quán)利要求2所述的語音識別方法，其特征在于，所述對所述第二音頻數(shù)據(jù)進行校準(zhǔn)處理，得到校準(zhǔn)處理后的第三音頻數(shù)據(jù)，以使所述第三音頻數(shù)據(jù)與所述第一音頻數(shù)據(jù)在時域上的誤差值小于或等于預(yù)設(shè)閾值，包括：

4.如權(quán)利要求2所述的語音識別方法，其特征在于，在所述對所述第一音頻數(shù)據(jù)進行降噪處理之前，所述方法還包括：

5.如權(quán)利要求4所述的語音識別方法，其特征在于，所述基于預(yù)設(shè)的選擇算法，從多組所述數(shù)據(jù)傳輸時延集合中選擇用于確定預(yù)設(shè)的時延基準(zhǔn)值的目標(biāo)數(shù)據(jù)傳輸時延集合，包括：

6.如權(quán)利要求5所述的語音識別方法，其特征在于，所述根據(jù)所述目標(biāo)數(shù)據(jù)傳輸時延集合確定出預(yù)設(shè)的時延基準(zhǔn)值，包括：

7.如權(quán)利要求1所述的語音識別方法，其特征在于，所述對所述第一音頻數(shù)據(jù)進行降噪處理，以去除所述第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù)，得到所述用戶語音數(shù)據(jù)，包括：

8.一種語音識別裝置，其特征在于，所述語音識別裝置包括：

9.一種計算機可讀存儲介質(zhì)，其特征在于，所述計算機可讀存儲介質(zhì)存儲有多條指令，所述指令適于處理器進行加載，以執(zhí)行權(quán)利要求1至7任一項所述的語音識別方法。

10.一種電子設(shè)備，其特征在于，包括處理器和存儲器，所述存儲器存儲有多條指令，所述處理器加載所述指令以執(zhí)行權(quán)利要求1至7任一項所述的語音識別方法。

技術(shù)總結(jié)
本申請實施例提供一種語音識別方法、裝置、介質(zhì)及設(shè)備，該方法通過獲取對應(yīng)同一時刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù)；根據(jù)第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù)，對第一音頻數(shù)據(jù)進行降噪處理，以去除第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù)，得到用戶語音數(shù)據(jù)；對用戶語音數(shù)據(jù)進行語音識別操作，得到與用戶語音數(shù)據(jù)對應(yīng)的語音控制指令。利用本申請實施例提供的語音識別方法，通過獲取對應(yīng)同一時刻的第一音頻數(shù)據(jù)及第二音頻數(shù)據(jù)，并基于第二音頻數(shù)據(jù)對第一音頻數(shù)據(jù)進行降噪處理，以去除第一音頻數(shù)據(jù)中的第一設(shè)備輸出音頻數(shù)據(jù)，從而得到用于語音識別操作的用戶語音數(shù)據(jù)，根據(jù)得到的用戶語音數(shù)據(jù)能夠提升對用戶意圖的識別準(zhǔn)確度。

技術(shù)研發(fā)人員：陳琳,白文星
受保護的技術(shù)使用者：深圳TCL數(shù)字技術(shù)有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/15

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳琳,白文星
技術(shù)所有人：深圳TCL數(shù)字技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：一種復(fù)合行星結(jié)構(gòu)升降齒輪箱的制作方法
上一篇：一種潤滑劑供給設(shè)備的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

語音識別方法、裝置、介質(zhì)及設(shè)備與流程

語音識別方法、裝置、介質(zhì)及設(shè)備與流程