音頻信號處理系統(tǒng)和音頻信號處理方法與流程

文檔序號：11924094閱讀：375來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及信號處理技術(shù)領(lǐng)域，尤其涉及一種音頻信號處理系統(tǒng)和音頻信號處理方法。

背景技術(shù)：

語音交互，已經(jīng)遍及我們生活的各個領(lǐng)域，如手機(jī)、電視、車載、空調(diào)等等領(lǐng)域。能夠進(jìn)行正常語音交互的前提是準(zhǔn)確識別語音信號。以手機(jī)終端為例，由于環(huán)境噪聲的存在，手機(jī)終端的麥克風(fēng)在采集用戶的有效聲源信號的同時，也會采集到環(huán)境噪聲信號，這些環(huán)境噪聲信號會對有效聲源信號的準(zhǔn)確識別造成干擾。

為了提高語音識別的準(zhǔn)確性，一種方式是采用麥克風(fēng)陣列以抑制噪聲的干擾，從而提升語音識別效果，其中一種簡單而常用的是雙麥克風(fēng)陣列結(jié)構(gòu)。以手機(jī)終端為例，雙麥克風(fēng)陣列由主麥克風(fēng)和輔麥克風(fēng)組成，分別設(shè)置在手機(jī)終端的不同位置，一般地，靠近用戶說話的位置處設(shè)置主麥克風(fēng)，遠(yuǎn)離用戶說話的位置設(shè)置輔麥克風(fēng)。其中，主麥克風(fēng)用于采集語音信號和環(huán)境噪聲，輔麥克風(fēng)采集環(huán)境噪聲，兩者信號進(jìn)行相減運算可以抑制環(huán)境噪聲對語音信號的干擾。

目前，在諸如手機(jī)終端等場景中，用戶在使用手機(jī)終端時，聲音源方位相對固定，從而雙麥克風(fēng)位置固定，即哪個作為主麥克風(fēng)哪個作為輔麥克風(fēng)已經(jīng)固定設(shè)置。但是，隨著各種智能交互產(chǎn)品的不斷問世，語音交互的場景發(fā)生了很大改變，聲音源相對智能交互產(chǎn)品的方位不再固定不變，此時，固定設(shè)置某個麥克風(fēng)作為主麥克風(fēng)、另一麥克風(fēng)作為輔麥克風(fēng)已經(jīng)不能靈活適應(yīng)智能語音交互場景的需求，很可能導(dǎo)致聲源信號的識別準(zhǔn)確性大大降低。

技術(shù)實現(xiàn)要素：

有鑒于此，本發(fā)明實施例提供一種音頻信號處理系統(tǒng)和音頻信號處理方法，能夠自適應(yīng)語音交互場景，有助于提高語音識別結(jié)果的準(zhǔn)確性。

本發(fā)明實施例提供一種音頻信號處理系統(tǒng)，包括：

由N個麥克風(fēng)組成的麥克風(fēng)陣列，控制器，連接組件，以及降噪組件，N為大于2的整數(shù)；其中，

所述N個麥克風(fēng)呈圓環(huán)狀分布；所述降噪組件的輸入端包括N-1個主麥克接口和1個輔麥克接口；

所述N個麥克風(fēng)分別與所述控制器連接，用于將采集的N路音頻信號輸入所述控制器；

所述控制器通過所述連接組件與所述降噪組件的輸入端連接，用于對所述N路音頻信號進(jìn)行信號強(qiáng)度比較，根據(jù)比較結(jié)果控制所述連接組件的輸出端與所述降噪組件的輸入端之間的連接關(guān)系。

本發(fā)明實施例提供一種音頻信號處理方法，包括：

獲取N路音頻信號，所述N路音頻信號是由N個呈圓環(huán)狀分布的麥克風(fēng)分別采集的，N為大于2的整數(shù)；

對所述N路音頻信號進(jìn)行信號強(qiáng)度比較；

根據(jù)信號強(qiáng)度比較結(jié)果，確定所述N路音頻信號中的N-1路主音頻信號和1路輔音頻信號；

以所述1路輔音頻信號對所述N-1路主音頻信號進(jìn)行降噪處理。

本發(fā)明實施例提供的音頻信號處理系統(tǒng)和音頻信號處理方法，該系統(tǒng)中包括由N個麥克風(fēng)組成的圓環(huán)形麥克風(fēng)陣列，控制器，連接組件，以及降噪組件，其中，控制器通過連接組件與降噪組件的N個輸入端連接。當(dāng)N個麥克風(fēng)分別采集到音頻信號時，將采集到的N路音頻信號輸入控制器，控制器對N路音頻信號進(jìn)行信號強(qiáng)度比較，根據(jù)比較結(jié)果自適應(yīng)地進(jìn)行N路音頻信號的主、輔角色定位。具體地，控制器根據(jù)N路音頻信號的信號強(qiáng)度比較結(jié)果控制連接組件的輸出端與降噪組件的主、輔麥克接口之間的連接關(guān)系，從而實現(xiàn)了根據(jù)音頻信號強(qiáng)度自適應(yīng)地切換主、輔麥克接口的輸入信號，以自適應(yīng)當(dāng)前的智能語音交互場景，也保證了降噪組件實現(xiàn)更佳的降噪效果，有助于提高語音識別結(jié)果的準(zhǔn)確性。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹，顯而易見地，下面描述中的附圖是本發(fā)明的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實施例提供的音頻信號處理系統(tǒng)實施例一的結(jié)構(gòu)示意圖；

圖2為本發(fā)明實施例提供的音頻信號處理系統(tǒng)實施例二的結(jié)構(gòu)示意圖；

圖3為本發(fā)明實施例提供的音頻信號處理方法實施例一的流程圖。

具體實施方式

為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚，下面將結(jié)合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實施例是本發(fā)明一部分實施例，而不是全部的實施例?；诒景l(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護(hù)的范圍。

在本發(fā)明實施例中使用的術(shù)語是僅僅出于描述特定實施例的目的，而非旨在限制本發(fā)明。在本發(fā)明實施例和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式，除非上下文清楚地表示其他含義，“多種”一般包含至少兩種，但是不排除包含至少一種的情況。

應(yīng)當(dāng)理解，本文中使用的術(shù)語“和/或”僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系，表示可以存在三種關(guān)系，例如，A和/或B，可以表示：單獨存在A，同時存在A和B，單獨存在B這三種情況。另外，本文中字符“/”，一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。

應(yīng)當(dāng)理解，盡管在本發(fā)明實施例中可能采用術(shù)語第一、第二、第三等來描述XXX，但這些XXX不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將XXX彼此區(qū)分開。例如，在不脫離本發(fā)明實施例范圍的情況下，第一XXX也可以被稱為第二XXX，類似地，第二XXX也可以被稱為第一XXX。

取決于語境，如在此所使用的詞語“如果”、“若”可以被解釋成為“在……時”或“當(dāng)……時”或“響應(yīng)于確定”或“響應(yīng)于檢測”。類似地，取決于語境，短語“如果確定”或“如果檢測(陳述的條件或事件)”可以被解釋成為“當(dāng)確定時”或“響應(yīng)于確定”或“當(dāng)檢測(陳述的條件或事件)時”或“響應(yīng)于檢測(陳述的條件或事件)”。

還需要說明的是，術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的商品或者系統(tǒng)不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種商品或者系統(tǒng)所固有的要素。在沒有更多限制的情況下，由語句“包括一個……”限定的要素，并不排除在包括所述要素的商品或者系統(tǒng)中還存在另外的相同要素。

圖1為本發(fā)明實施例提供的音頻信號處理系統(tǒng)實施例一的結(jié)構(gòu)示意圖，如圖1所示，該系統(tǒng)包括：

由N個麥克風(fēng)組成的麥克風(fēng)陣列1，控制器2，連接組件3，以及降噪組件4，N為大于2的整數(shù)。

其中，如圖1所示，該N個麥克風(fēng)呈圓環(huán)狀分布，圖中示意出了該麥克風(fēng)陣列包括11、12、13、14四個麥克風(fēng)。

在本實施例中，該圓環(huán)形狀的麥克風(fēng)陣列為全向麥克風(fēng)陣列，即通過該圓環(huán)形狀的麥克風(fēng)陣列可以接收全方位的音頻信號。

在實際應(yīng)用中，這N個麥克風(fēng)可以是均勻分布的，也可以根據(jù)實際應(yīng)用情況非均勻分布，比如結(jié)合實際應(yīng)用場景，如果用戶在某些方位說話的可能性更大，則在該方位上，可以布設(shè)比較多的麥克風(fēng)，在不易說話的方位，布設(shè)少量麥克風(fēng)。

本實施例中提供的上述音頻信號處理系統(tǒng)可以適用于多種智能交互產(chǎn)品中，本實施例中，以應(yīng)用在智能移動機(jī)器人中為例，此時，麥克風(fēng)陣列1可以被水平設(shè)置在機(jī)器人機(jī)身上的適當(dāng)位置，比如麥克風(fēng)陣列1設(shè)置在機(jī)器人頭部。

當(dāng)該機(jī)器人被啟動語音交互功能后，麥克風(fēng)陣列1用于采集用戶交互語音。

如圖1所示，N個麥克風(fēng)分別與控制器2連接，用于將采集的N路音頻信號輸入控制器2。在一種可選連接方式中，N個麥克風(fēng)可以直接與控制器2連接，此時，如圖1所示，在包含11、12、13、14四個麥克風(fēng)的舉例中，這四個麥克風(fēng)分別連接到控制器2的a1、a2、a3、a4四個輸入端。

本實施例中，控制器2進(jìn)一步通過連接組件3與降噪組件4的輸入端連接，其中，降噪組件4的輸入端包括N-1個主麥克接口和1個輔麥克接口。具體地，如圖1中示意的，控制器2的四個輸出端b1、b2、b3、b4分別與連接組件3的四個輸入端c1、c2、c3、c4對應(yīng)固定連接，連接組件3的四個輸出端d1、d2、d3、d4則可以切換與降噪組件4的N-1個主麥克接口和1個輔麥克接口之間的連接關(guān)系，圖1中，以z1、z2、z3示意主麥克接口，以f示意輔麥克接口。

可選地，該連接組件3可以實現(xiàn)為N個開關(guān)。

在實際應(yīng)用中，當(dāng)某個用戶開始說話時，觸發(fā)N個麥克風(fēng)采集音頻信號，將采集的N路音頻信號通過控制器2的輸入端輸入給控制器2，進(jìn)而，控制器2對N路音頻信號進(jìn)行信號強(qiáng)度比較，根據(jù)比較結(jié)果控制連接組件3的輸出端與降噪組件4的輸入端之間的連接關(guān)系，以將根據(jù)信號強(qiáng)度比較結(jié)果確定的主音頻信號輸入至降噪組件4的主麥克接口，輔音頻信號輸入至降噪組件4的輔麥克接口。

具體地，控制器2確定信號強(qiáng)度最低的一路音頻信號為輔音頻信號，其他N-1路音頻信號為主音頻信號，從而，控制連接組件3將信號強(qiáng)度最低的一路音頻信號輸入至1個輔麥克接口，將其他的N-1路音頻信號分別輸入至N-1個主麥克接口。

其中，主麥克接口和輔麥克接口可以被視為是對音頻信號的信號屬性的表征。具體來說，可以將從主麥克接口輸入的音頻信號視為聲音源信號，即含有有效語音成分更多的信號，將從輔麥克接口輸入的音頻信號視為噪聲信號，從而觸發(fā)降噪組件4根據(jù)輔麥克接口輸入的音頻信號對從主麥克接口輸入的音頻信號的降噪處理。

具體地，控制器2在接收到N路音頻信號后，可以通過對這N路音頻信號分別進(jìn)行一定的信號處理，比如放大、濾波等處理，求取這N路音頻信號的信號強(qiáng)度，進(jìn)行比較。

本實施例中，可選地，控制器2可以使用各種應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、微中控元件、微處理器或其他電子元件實現(xiàn)。

本實施例提供的音頻信號處理系統(tǒng)中包括由N個麥克風(fēng)組成的圓環(huán)形麥克風(fēng)陣列，控制器，連接組件，以及降噪組件，其中，控制器通過連接組件與降噪組件的N個輸入端連接。當(dāng)N個麥克風(fēng)分別采集到音頻信號時，將采集到的N路音頻信號輸入控制器，控制器對N路音頻信號進(jìn)行信號強(qiáng)度比較，根據(jù)比較結(jié)果自適應(yīng)地進(jìn)行N路音頻信號的主、輔角色定位。具體地，控制器根據(jù)N路音頻信號的信號強(qiáng)度比較結(jié)果控制連接組件的輸出端與降噪組件的主、輔麥克接口之間的連接關(guān)系，從而實現(xiàn)了根據(jù)音頻信號強(qiáng)度自適應(yīng)地切換主、輔麥克接口的輸入信號，以自適應(yīng)當(dāng)前的智能語音交互場景，也保證了降噪組件實現(xiàn)更佳的降噪效果，有助于提高語音識別結(jié)果的準(zhǔn)確性。

圖2為本發(fā)明實施例提供的音頻信號處理系統(tǒng)實施例二的結(jié)構(gòu)示意圖，如圖2所示，在圖1所示實施例基礎(chǔ)上，可選地，該系統(tǒng)還包括：

分別與N個麥克風(fēng)和控制器2連接的橋接器5，其中：

橋接器5，用于將N路音頻信號轉(zhuǎn)換為一路音頻信號傳輸給控制器2；

控制器2還用于：將一路音頻信號還原為N路音頻信號。

由于支持多路音頻信號輸入的控制器成本較貴，且接口數(shù)量很有限，為了降低成本以及避免控制器接口數(shù)量的限制，本實施例中提供了上述橋接器5。

如圖2所示，由于橋接器5具有N個音頻信號輸入端口和一個音頻信號輸出端口，其分別接收N路音頻信號，將N路音頻信號轉(zhuǎn)換為一路后，輸入給控制器2，控制器2為了接收N路音頻信號只需要設(shè)置一個輸入接口a1即可，實現(xiàn)方便、成本低廉。而橋接器可以選擇一個CPLD或者FPGA就可以方便實現(xiàn)。

可選地，該系統(tǒng)還包括：防塵防風(fēng)裝置6。其中，麥克風(fēng)陣列1安裝在防塵防風(fēng)裝置6內(nèi)。

本實施例中，為了物理上盡量保證環(huán)境因素對語音識別結(jié)果的不利影響，在麥克風(fēng)陣列的組裝工藝上提供了防塵防風(fēng)裝置6，以盡量降低環(huán)境因素對語音識別結(jié)果的不利影響。

其中，防塵防風(fēng)裝置6中比如包括防風(fēng)棉、防塵網(wǎng)等結(jié)構(gòu)，以降低風(fēng)聲、粉塵對麥克風(fēng)陣列的影響。

可選地，該系統(tǒng)還包括：語音識別組件7和交互組件8。

其中，語音識別組件7分別與降噪組件4的輸出端和控制器2連接，用于對降噪后的音頻信號進(jìn)行語音識別，將語音識別結(jié)果輸入給控制器2。

控制器2還用于根據(jù)語音識別結(jié)果控制交互組件8進(jìn)行相應(yīng)的交互反饋。

本發(fā)明實施例提供的音頻信號處理系統(tǒng)一般適用于智能語音交互的產(chǎn)品中，為了實現(xiàn)智能語音交互功能，在通過降噪組件4對輸入的N路音頻信號進(jìn)行了降噪處理后，降噪后的音頻信號輸入給語音識別組件7，以完成用戶輸入語音的語音識別處理。同時，為了實現(xiàn)基于語音的智能交互，以機(jī)器人為例，需要基于語音識別結(jié)果向用戶進(jìn)行相應(yīng)的反饋。本實施例中，以機(jī)器人為例，該交互組件8比如可以是語音播放器，控制器2可以基于語音識別結(jié)果通過語音播放器向用戶反饋應(yīng)答語音；再比如可以是顯示屏，控制器2可以基于語音識別結(jié)果通過顯示屏向用戶反饋某種業(yè)務(wù)操作界面；再比如還可以是運動部件，控制器2可以基于語音識別結(jié)果通過控制運動部件使機(jī)器人執(zhí)行相應(yīng)的反饋動作，等等。

圖3為本發(fā)明實施例提供的音頻信號處理方法實施例一的流程圖，本實施例提供的該音頻信號處理方法可以由一音頻信號處理系統(tǒng)來執(zhí)行，該音頻信號處理系統(tǒng)可以實現(xiàn)為硬件，或者實現(xiàn)為軟件和硬件的組合，該音頻信號處理系統(tǒng)可以集成設(shè)置比如移動機(jī)器人等語音交互設(shè)備中，比如可以是圖1、圖2所示的系統(tǒng)結(jié)構(gòu)。如圖3所示，該方法包括如下步驟：

步驟101、獲取N路音頻信號，N路音頻信號是由N個呈圓環(huán)狀分布的麥克風(fēng)分別采集的。

其中，N為大于2的整數(shù)。

步驟102、對N路音頻信號進(jìn)行信號強(qiáng)度比較。

步驟103、根據(jù)信號強(qiáng)度比較結(jié)果，確定N路音頻信號中的N-1路主音頻信號和1路輔音頻信號。

步驟104、以該1路輔音頻信號對N-1路主音頻信號進(jìn)行降噪處理。

具體地，根據(jù)信號強(qiáng)度比較結(jié)果，確定N路音頻信號中的N-1路主音頻信號和1路輔音頻信號，包括：

根據(jù)信號強(qiáng)度的比較結(jié)果，確定信號強(qiáng)度最低的一路音頻信號為輔音頻信號，其他N-1路音頻信號為主音頻信號。

本實施例提供的音頻信號處理方法的具體適用場景和詳細(xì)過程，可以參見前述系統(tǒng)實施例中的說明，在此不贅述。

以上所描述的系統(tǒng)實施例僅僅是示意性的，其中所述作為分離部件說明的單元(諸如各種組件、裝置等)可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個地方，或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動的情況下，即可以理解并實施。

通過以上的實施方式的描述，本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施方式可借助加必需的通用硬件平臺的方式來實現(xiàn)，當(dāng)然也可以通過硬件?；谶@樣的理解，上述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以產(chǎn)品的形式體現(xiàn)出來，該計算機(jī)產(chǎn)品可以存儲在計算機(jī)可讀存儲介質(zhì)中，如ROM/RAM、磁碟、光盤等，包括若干指令用以使得一臺計算機(jī)裝置(可以是個人計算機(jī)，服務(wù)器，或者網(wǎng)絡(luò)裝置等)執(zhí)行各個實施例或者實施例的某些部分所述的方法。

最后應(yīng)說明的是：以上實施例僅用以說明本發(fā)明的技術(shù)方案，而非對其限制；盡管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解：其依然可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改，或者對其中部分技術(shù)特征進(jìn)行等同替換；而這些修改或者替換，并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：蔣化冰;齊鵬舉;方園;米萬珠;舒劍;吳琨;管偉;羅璇;羅承雄;張海建
技術(shù)所有人：上海木爺機(jī)器人技術(shù)有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

音頻信號處理相關(guān)技術(shù)

混疊音頻信號的處理相關(guān)技術(shù)

音頻信號通信傳輸系統(tǒng)相關(guān)技術(shù)

功放音頻信號處理理相關(guān)技術(shù)

音頻數(shù)字信號處理相關(guān)技術(shù)

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

音頻信號處理系統(tǒng)和音頻信號處理方法與流程