本發(fā)明屬于語音識(shí)別,具體為一種基于離線和云端于一體的語音識(shí)別模組。
背景技術(shù):
1、隨著智能家居的興起和發(fā)展,越來越多家用設(shè)備實(shí)現(xiàn)智能化,通過無線射頻、藍(lán)牙、wi?f?i等取代傳統(tǒng)的控制方式,可以讓使用更方便和實(shí)現(xiàn)更多的功能。然而這些智能控制方式都需要通過遙控器或手機(jī)app等特定的終端,因此存在需要使用時(shí)找不到終端的情況,更有可能遇到遙控器沒電、手機(jī)沒電等問題,同時(shí)這些終端的復(fù)雜操作對(duì)于學(xué)習(xí)接收能力較弱的老人、小孩等也不夠友好。
2、目前市場(chǎng)上的智能家居語音控制方式一般為通過一個(gè)必須接入互聯(lián)網(wǎng)的中轉(zhuǎn)設(shè)備(如智能音箱、中控屏)來進(jìn)行語音識(shí)別,在不能接入互聯(lián)網(wǎng)時(shí)無法使用,因此有很大的使用局限性,而且由于接入互聯(lián)網(wǎng)在安全性和隱私性上也存在隱患,因此需要對(duì)其進(jìn)行改造和優(yōu)化。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于離線和云端于一體的語音識(shí)別模組,以解決上述背景技術(shù)中提出的問題。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于離線和云端于一體的語音識(shí)別模組,該模組集成了主控mcu芯片(jl7014)、功放芯片(u3)、貼片無源晶振(y1)、貼片電容(c5、l2、c8、c13、c14、c1、c6、c10、c12、c2、c7、c9、c11)、貼片電阻(r1、r2、r3、r4)和貼片電感(l1、l3、l4)元器件,支持藍(lán)牙m(xù)esh功能,具有設(shè)備端和手機(jī)端連接的功能。
3、優(yōu)選地,該模組內(nèi)置了高性能降噪算法、遠(yuǎn)距離拾音算法,語音識(shí)別精度高,具有實(shí)現(xiàn)ai交互和通過微信小程序添加和控制設(shè)備的功能。
4、優(yōu)選地,該模組支撐uart、i2c、pwm和gpio接口,可作為主設(shè)備和從設(shè)備,該離線語音模組使用高性能雙核32位指令集cpu(支持fpu)、兼容藍(lán)牙m(xù)esh規(guī)范。
5、優(yōu)選地,該模組提供了用于大噪聲設(shè)備上的語音喚醒方法,該方法的步驟為:
6、步驟一,準(zhǔn)備數(shù)據(jù):準(zhǔn)備用于訓(xùn)練語音喚醒模型的訓(xùn)練數(shù)據(jù);
7、步驟二,信號(hào)特征提取:對(duì)訓(xùn)練集中的加噪音頻信號(hào)進(jìn)行特征提取,在完成預(yù)加重、分幀、加窗、離散傅里葉變換、梅爾三角濾波器濾波并取對(duì)數(shù)后,每一幀的音頻信號(hào)提取到40維的fbank特征;
8、步驟三,組合音頻特征:將得到的帶噪音頻特征分別和對(duì)應(yīng)的干凈音頻特征按照加噪特征和干凈特征的方式一一進(jìn)行組合;
9、步驟四,構(gòu)建標(biāo)簽:構(gòu)建喚醒識(shí)別的喚醒標(biāo)簽;
10、步驟五,搭建訓(xùn)練模型:搭建主干部分為四層的單向gru層,隨后是一層fc全連接層的訓(xùn)練模型。
11、步驟六,喚醒詞檢測(cè):對(duì)音頻段進(jìn)行喚醒詞檢測(cè)。
12、優(yōu)選地,該模組設(shè)計(jì)使用了1塊離線語音模組zxj2406j0xf4.e0,通過藍(lán)牙連小度中控屏和小度音箱,可連小度app,并且同時(shí)具備在線和離線語音互動(dòng)功能。
13、優(yōu)選地,該模組設(shè)計(jì)使用了pa電路,具有根據(jù)實(shí)際情況更改相應(yīng)電阻大小,調(diào)節(jié)喇叭音量大小的功能。
14、優(yōu)選地,所述pa電路包含一顆帶關(guān)斷模式的音頻功放芯片(u3),在5v輸入電壓下工作時(shí),負(fù)載(3ω)上的平均功率為3w,且失真率不超過10%。該芯片工作穩(wěn)定,增益帶寬積高達(dá)2.5mhz,并且單位增益穩(wěn)定。通過配置外圍電阻,可以調(diào)整放大器的電壓增益,方便應(yīng)用。如:把r3電阻阻值降低,可以調(diào)整放大器的電壓增益,增加喇叭音量。
15、優(yōu)選地,該模組設(shè)計(jì),可語音聲控,通過小度音箱、小度中控屏、麥克風(fēng)下發(fā)語音指令,也可通過小度app和微信小程序遠(yuǎn)程無線控制。
16、本發(fā)明的有益效果如下:
17、本發(fā)明通過與現(xiàn)有技術(shù)相比,更加智能化,可靠性更強(qiáng),功能更多,增設(shè)了語音識(shí)別的聲控技術(shù)、手機(jī)app或微信小程序遠(yuǎn)程無線智能控制,本設(shè)計(jì)產(chǎn)品,可以通過無線音箱.中控屏.手機(jī)app等無線連接后,可以定制化搭載家電設(shè)備,產(chǎn)生聯(lián)動(dòng)的應(yīng)用場(chǎng)景,并且可以在離線斷網(wǎng)情況下,通過喇叭和麥克風(fēng),依然能進(jìn)行智能操作,本模組具備卓越的多項(xiàng)功能,不僅實(shí)現(xiàn)了非特定人的廣泛識(shí)別能力,還針對(duì)固定命令詞進(jìn)行了深度優(yōu)化,覆蓋了絕大多數(shù)常用及小家電品類的控制需求,對(duì)于特殊未包含的詞匯,更提供個(gè)性化定制服務(wù),其擁有超高的語音識(shí)別率,確保指令的準(zhǔn)確無誤,內(nèi)置的高效降噪功能,即使在中等噪聲環(huán)境下也能穩(wěn)定運(yùn)行,為用戶提供清晰流暢的交互體驗(yàn),此外,該系統(tǒng)支持uart、i2c、pwm、gpio等多種通信協(xié)議,便于與各類硬件設(shè)備無縫對(duì)接,并可靈活驅(qū)動(dòng)多種類型的揚(yáng)聲器,滿足多樣化的應(yīng)用場(chǎng)景需求。
1.一種基于離線和云端于一體的語音識(shí)別模組,其特征在于:該模組集成了主控mcu芯片(jl7014)、功放芯片(u3)、貼片無源晶振(y1)、貼片電容(c5、l2、c8、c13、c14、c1、c6、c10、c12、c2、c7、c9、c11)、貼片電阻(r1、r2、r3、r4)和貼片電感(l1、l3、l4)元器件,支持藍(lán)牙m(xù)esh功能,具有設(shè)備端和手機(jī)端連接的功能。
2.根據(jù)權(quán)利要求1所述的一種基于離線和云端于一體的語音識(shí)別模組,其特征在于:該模組內(nèi)置了高性能降噪算法、遠(yuǎn)距離拾音算法,語音識(shí)別精度高,具有實(shí)現(xiàn)ai交互和通過微信小程序添加和控制設(shè)備的功能。
3.根據(jù)權(quán)利要求1所述的一種基于離線和云端于一體的語音識(shí)別模組,其特征在于:該模組支撐uart、i2c、pwm和gpio接口,可作為主設(shè)備和從設(shè)備,該離線語音模組使用高性能雙核32位指令集cpu(支持fpu)、兼容藍(lán)牙m(xù)esh規(guī)范。
4.根據(jù)權(quán)利要求1所述的一種基于離線和云端于一體的語音識(shí)別模組,其特征在于:該模組提供了用于大噪聲設(shè)備上的語音喚醒方法,該方法的步驟為:
5.根據(jù)權(quán)利要求1所述的一種基于離線和云端于一體的語音識(shí)別模組,其特征在于:該模組設(shè)計(jì)使用了1塊離線語音模組zxj2406j0xf4.e0,通過藍(lán)牙連小度中控屏和小度音箱,可連小度app,并且同時(shí)具備在線和離線語音互動(dòng)功能。
6.根據(jù)權(quán)利要求1所述的一種基于離線和云端于一體的語音識(shí)別模組,其特征在于:該模組設(shè)計(jì)使用了pa電路,具有根據(jù)實(shí)際情況更改相應(yīng)電阻大小,調(diào)節(jié)喇叭音量大小的功能。
7.根據(jù)權(quán)利要求6所述的一種基于離線和云端于一體的語音識(shí)別模組,其特征在于:所述pa電路包含一顆帶關(guān)斷模式的音頻功放芯片(u3),在5v輸入電壓下工作時(shí),負(fù)載(3ω)上的平均功率為3w,且失真率不超過10%;該芯片工作穩(wěn)定,增益帶寬積高達(dá)2.5mhz,并且單位增益穩(wěn)定;通過配置外圍電阻,可調(diào)整放大器的電壓增益,方便應(yīng)用。
8.根據(jù)權(quán)利要求1所述的一種基于離線和云端于一體的語音識(shí)別模組,其特征在于:該模組可語音聲控,通過小度音箱、小度中控屏、麥克風(fēng)下發(fā)語音指令,也可通過小度app和微信小程序遠(yuǎn)程無線控制。