本發(fā)明涉及一種攝像頭,具體的說,涉及一種可遠(yuǎn)講拾音降噪消回聲的攝像頭,屬于遠(yuǎn)講拾音技術(shù)領(lǐng)域。
背景技術(shù):
隨著網(wǎng)絡(luò)帶寬的升級,視頻編解碼技術(shù)發(fā)展,以及音頻信號處理技術(shù)的進步,使得基于遠(yuǎn)距離的音視頻網(wǎng)絡(luò)通信以及人機交互的需求逐漸增加,這就需要一種高性能的終端,來滿足遠(yuǎn)講音視頻采集及信號處理的需求,目前市面上的音視頻采集攝像頭在采集距離、信號質(zhì)量等方面都無法滿足需求。
現(xiàn)有的與本專利最相似的產(chǎn)品是usb攝像頭產(chǎn)品,此類產(chǎn)品的核心是視頻采集攝像頭,音頻拾音部分的功能較弱,拾音距離通常在1米以內(nèi),不具備降噪和消回聲功能,沒有語音識別前端處理,拾取到的語音信號無法直接用來做語音識別用。
綜上可知,現(xiàn)有技術(shù)在實際使用上顯然存在不便與缺陷,所以有必要加以改進。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是針對以上不足,提供一種可遠(yuǎn)講拾音降噪消回聲的攝像頭,其拾音距離可達3米到5米;還可以降噪和消回聲,其中降噪能力為15-20db,消回聲能力為大于80dbspl;語音識別前端處理,為語音識別應(yīng)用提供高質(zhì)量語音信號,提高語音識別率;節(jié)約成本至少17.5%。
為解決以上技術(shù)問題,本發(fā)明采用以下技術(shù)方案:一種可遠(yuǎn)講拾音降噪消回聲的攝像頭,包括攝像頭和應(yīng)用平臺,所述攝像頭連接應(yīng)用平臺。
一種優(yōu)化方案,所述攝像頭內(nèi)設(shè)置有視頻傳感器、麥克風(fēng)1、麥克風(fēng)2、信號處理器;
所述麥克風(fēng)1、麥克風(fēng)2并列連接信號處理器;
所述信號處理器還通過圖像接口連接視頻傳感器;
所述信號處理器還通過usb接口連接應(yīng)用平臺;
所述應(yīng)用平臺還設(shè)置有連接信號處理器的線路,所述線路用于傳輸回聲參考;
所述應(yīng)用平臺內(nèi)設(shè)有處理模塊。
進一步地,所述麥克風(fēng)1和麥克風(fēng)2水平排列,麥克風(fēng)1和麥克風(fēng)2的間距4cm-10cm,所述麥克風(fēng)1和麥克風(fēng)2形成麥克風(fēng)陣列,采用陣列麥克風(fēng)技術(shù),對音頻信號進行處理。
進一步地,所述視頻傳感器采用高清視頻傳感器,用于采集光信號,并將光信號轉(zhuǎn)換為電信號;
麥克風(fēng)1用于采集聲信號,并將聲信號轉(zhuǎn)換為電信號;
麥克風(fēng)2用于采集聲信號,并將聲信號轉(zhuǎn)換為電信號;
所述信號處理器采用音視頻信號處理器,用于對高清視頻傳感器、麥克風(fēng)1和麥克風(fēng)2采集到的信號進行放大、編碼處理;
應(yīng)用平臺,所述處理模塊用于遠(yuǎn)講拾音降噪消回音處理;應(yīng)用平臺上還設(shè)置有揚聲器。
進一步地,所述處理模塊內(nèi)進行采音處理,麥克風(fēng)1和麥克風(fēng)2采用麥克風(fēng)陣列將目標(biāo)語音連同噪聲以及揚聲器播放出來的回聲一起采集到,得到混合信號。
進一步地,所述處理模塊內(nèi)進行降噪處理,通過譜減方式將噪聲去除掉。
進一步地,所述處理模塊內(nèi)進行消回聲處理,采集揚聲器的電信號,將揚聲器的電信號作為消回聲處理的回聲參考信號,利用自適應(yīng)濾波,將揚聲器播放出來的回聲部分去除。
進一步地,所述處理模塊內(nèi)進行遠(yuǎn)講拾音處理,利用自動增益控制技術(shù),對信號進行增益調(diào)節(jié),當(dāng)信號大,則增益調(diào)小,當(dāng)信號小,則增益調(diào)大。
進一步地,所述處理模塊實現(xiàn)遠(yuǎn)講拾音、降噪、消回聲的步驟如下:
步驟1:采音:麥克風(fēng)1和麥克風(fēng)2采用麥克風(fēng)陣列將目標(biāo)語音連同噪聲以及揚聲器播放出來的回聲一起采集到,得到混合信號;
步驟2:降噪:利用噪聲頻譜的穩(wěn)定性,通過譜減方式將噪聲從步驟1輸出的混合信號中去除掉,得到降噪信號;
步驟3:消回聲:處理模塊采集揚聲器的電信號,將揚聲器的電信號作為消回聲處理的回聲參考信號,利用自適應(yīng)濾波,將揚聲器播放出來的回聲部分從步驟2輸出的降噪信號中去除,得到消回聲信號;
步驟4:遠(yuǎn)講拾音:利用自動增益控制技術(shù),對步驟3輸出的消回聲信號進行增益調(diào)節(jié),當(dāng)步驟3輸出的消回聲信號大,則增益調(diào)小,當(dāng)步驟3輸出的消回聲信號小,則增益調(diào)大,從而達到無論步驟3輸出的消回聲信號是大是小,輸出信號都保證比較穩(wěn)定。
本發(fā)明采用以上技術(shù)方案后,與現(xiàn)有技術(shù)相比,具有以下優(yōu)點:
本發(fā)明在攝像頭產(chǎn)品中增加遠(yuǎn)講拾音,拾音距離可達3米到5米;在攝像頭中增加降噪和消回聲,其中降噪能力為15-20db,消回聲能力為大于80dbspl;在攝像頭中增加語音識別前端處理,為語音識別應(yīng)用提供高質(zhì)量語音信號,提高語音識別率;本專利產(chǎn)品節(jié)約成本至少17.5%。
下面結(jié)合附圖和實施例對本發(fā)明進行詳細(xì)說明。
附圖說明
附圖1是本發(fā)明的原理圖;
附圖2是處理模塊進行信號處理的示意圖。
具體實施方式
為了對本發(fā)明的技術(shù)特征、目的和效果有更加清楚的理解,現(xiàn)對照附圖說明本發(fā)明的具體實施方式。
實施例1一種可遠(yuǎn)講拾音降噪消回聲的攝像頭
如圖1所示,本發(fā)明提供一種可遠(yuǎn)講拾音降噪消回聲的攝像頭,所述攝像頭連接應(yīng)用平臺。
所述攝像頭內(nèi)設(shè)置有視頻傳感器、麥克風(fēng)1、麥克風(fēng)2、信號處理器;
所述麥克風(fēng)1、麥克風(fēng)2并列連接信號處理器;
所述信號處理器還通過圖像接口連接視頻傳感器;
所述信號處理器還通過usb接口連接應(yīng)用平臺;
所述應(yīng)用平臺還設(shè)置有連接信號處理器的線路用于傳輸回聲參考;
所述應(yīng)用平臺內(nèi)設(shè)有處理模塊。
所述視頻傳感器采用高清視頻傳感器,用于采集光信號,并將光信號轉(zhuǎn)換為電信號;
麥克風(fēng)1用于采集聲信號,并將聲信號轉(zhuǎn)換為電信號;
麥克風(fēng)2用于采集聲信號,并將聲信號轉(zhuǎn)換為電信號;
所述信號處理器采用音視頻信號處理器,用于對高清視頻傳感器、麥克風(fēng)1和麥克風(fēng)2采集到的信號進行放大、編碼處理;
應(yīng)用平臺,所述應(yīng)用平臺內(nèi)設(shè)置有處理模塊,所述處理模塊用于遠(yuǎn)講拾音降噪消回音處理;應(yīng)用平臺上還設(shè)置有揚聲器;
所述麥克風(fēng)1和麥克風(fēng)2水平排列,麥克風(fēng)1和麥克風(fēng)2的間距4cm-10cm,形成麥克風(fēng)陣列,采用陣列麥克風(fēng)技術(shù),對音頻信號進行處理。
如圖2所示,所述處理模塊實現(xiàn)遠(yuǎn)講拾音、降噪、消回聲功能的步驟如下:
步驟1:采音:麥克風(fēng)1和麥克風(fēng)2采用麥克風(fēng)陣列將目標(biāo)語音連同噪聲以及揚聲器播放出來的回聲一起采集到,得到混合信號;
步驟2:降噪:利用噪聲頻譜的穩(wěn)定性,通過譜減等方式將噪聲從步驟1輸出的混合信號中去除掉,得到降噪信號;
步驟3:消回聲:處理模塊采集揚聲器的電信號,將揚聲器的電信號作為消回聲處理的回聲參考信號,利用自適應(yīng)濾波,將揚聲器播放出來的回聲部分從步驟2輸出的降噪信號中去除,得到消回聲信號;
步驟4:遠(yuǎn)講拾音:利用自動增益控制技術(shù),對步驟3輸出的消回聲信號進行增益調(diào)節(jié),當(dāng)步驟3輸出的消回聲信號大,則增益調(diào)小,當(dāng)步驟3輸出的消回聲信號小,則增益調(diào)大,從而達到無論步驟3輸出的消回聲信號是大是小,輸出信號都保證比較穩(wěn)定。
本發(fā)明提供一種可遠(yuǎn)講拾音降噪消回聲的攝像頭,在攝像頭產(chǎn)品中增加遠(yuǎn)講拾音;遠(yuǎn)講拾音用于增加拾音距離,拾取更遠(yuǎn)距離的聲音,典型拾音距離3米到5米;在攝像頭中增加降噪和消回聲;降噪和消回聲用于降低拾取到的聲音中的噪聲和回聲,使得拾取到的聲音更加清晰;使用硬件方式采集回聲參考信號,其中硬件方式包括通過av接口、耳機接口或功放前接口采集信號;將麥克風(fēng)1和麥克風(fēng)2拾取到的混合信號,以及回聲參考信號一起在信號處理器中重新采樣,得到同步的回聲信號和回聲參考信號,然后傳給應(yīng)用平臺,應(yīng)用平臺內(nèi)的處理模塊直接使用同步好的語音數(shù)據(jù)做處理;使用av接口作為采集回聲參考信號物理接口,av接口是機頂盒、電視機、網(wǎng)絡(luò)視頻機等應(yīng)用平臺的標(biāo)準(zhǔn)接口,使用此接口,無需對應(yīng)用平臺硬件進行修改,使得此產(chǎn)品不僅可以在定制應(yīng)用平臺中使用,也可以在市面上大量非定制平臺上使用,通用性好;在攝像頭中增加語音識別前端處理,語音識別通過人口述指令來實現(xiàn)設(shè)備的某種操作,比如增加了本發(fā)明的所述攝像頭的電視機,用戶可以對電視機喊“音量大點”,則電視機就會自動將音量調(diào)大。
以上所述為本發(fā)明最佳實施方式的舉例,其中未詳細(xì)述及的部分均為本領(lǐng)域普通技術(shù)人員的公知常識。本發(fā)明的保護范圍以權(quán)利要求的內(nèi)容為準(zhǔn),任何基于本發(fā)明的技術(shù)啟示而進行的等效變換,也在本發(fā)明的保護范圍之內(nèi)。