本發(fā)明實(shí)施例涉及語(yǔ)音識(shí)別與智能控制,具體涉及一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法及系統(tǒng)。
背景技術(shù):
1、隨著物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,智能設(shè)備在人們的生活和工作中得到了廣泛應(yīng)用。語(yǔ)音識(shí)別作為一種重要的人機(jī)交互方式,為用戶(hù)操作智能設(shè)備提供了極大的便利。然而,目前大多數(shù)語(yǔ)音識(shí)別控制系統(tǒng)依賴(lài)于網(wǎng)絡(luò)連接,通過(guò)將語(yǔ)音數(shù)據(jù)上傳至云端進(jìn)行處理,再接收云端返回的控制指令來(lái)實(shí)現(xiàn)設(shè)備控制。這種在線語(yǔ)音識(shí)別方式存在諸多弊端:
2、網(wǎng)絡(luò)依賴(lài)問(wèn)題:當(dāng)網(wǎng)絡(luò)信號(hào)不穩(wěn)定、中斷或處于無(wú)網(wǎng)絡(luò)環(huán)境時(shí),語(yǔ)音識(shí)別功能無(wú)法正常使用,導(dǎo)致設(shè)備控制失效。例如,在偏遠(yuǎn)地區(qū)、地下停車(chē)場(chǎng)或信號(hào)較弱的室內(nèi)場(chǎng)所,用戶(hù)可能無(wú)法順利通過(guò)語(yǔ)音指令控制智能設(shè)備。
3、隱私安全風(fēng)險(xiǎn):語(yǔ)音數(shù)據(jù)在傳輸至云端的過(guò)程中,存在被竊取、篡改或泄露的風(fēng)險(xiǎn),用戶(hù)的隱私安全難以得到有效保障。特別是對(duì)于一些涉及個(gè)人敏感信息的語(yǔ)音指令,如家庭安防系統(tǒng)的控制指令,一旦隱私泄露,可能會(huì)給用戶(hù)帶來(lái)嚴(yán)重的安全隱患。
4、響應(yīng)延遲:由于語(yǔ)音數(shù)據(jù)需要經(jīng)過(guò)上傳、云端處理和下載控制指令等多個(gè)環(huán)節(jié),會(huì)產(chǎn)生一定的響應(yīng)延遲。這在對(duì)實(shí)時(shí)性要求較高的控制場(chǎng)景中,如智能燈光的快速開(kāi)關(guān)、智能窗簾的即時(shí)開(kāi)合等,會(huì)影響用戶(hù)體驗(yàn)。
5、離線語(yǔ)音識(shí)別是在本地設(shè)備上完成語(yǔ)音識(shí)別和指令處理,無(wú)需依賴(lài)網(wǎng)絡(luò)連接,具有響應(yīng)速度快、隱私安全等優(yōu)點(diǎn)。然而,現(xiàn)有的離線語(yǔ)音識(shí)別系統(tǒng)在設(shè)備間的互聯(lián)互通和擴(kuò)展性方面存在不足。傳統(tǒng)的藍(lán)牙技術(shù)在連接設(shè)備數(shù)量上有限,且通信范圍較小,難以滿(mǎn)足大規(guī)模智能設(shè)備組網(wǎng)的需求。
技術(shù)實(shí)現(xiàn)思路
1、為此,本發(fā)明實(shí)施例提供一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法及系統(tǒng),以解決目前大多數(shù)語(yǔ)音識(shí)別控制系統(tǒng)依賴(lài)于網(wǎng)絡(luò)連接,離線語(yǔ)音識(shí)別系統(tǒng)在設(shè)備間的互聯(lián)互通和擴(kuò)展性方面存在不足,連接設(shè)備數(shù)量上有限,且通信范圍較小的問(wèn)題。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供如下技術(shù)方案:
3、根據(jù)本發(fā)明實(shí)施例的第一方面,提供了一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,所述方法包括:
4、s1、采集來(lái)自用戶(hù)的第一語(yǔ)音信號(hào),并對(duì)采集到的第一語(yǔ)音信號(hào)進(jìn)行預(yù)處理,形成第二語(yǔ)音信號(hào);
5、s2、利用預(yù)先本地部署的語(yǔ)音識(shí)別模型對(duì)所述第二語(yǔ)音信號(hào)進(jìn)行識(shí)別,將音頻文件轉(zhuǎn)換為文本指令;
6、s3、獲取所述文本指令并對(duì)所述文本指令進(jìn)行解析和語(yǔ)義理解,提取控制信息并根據(jù)預(yù)設(shè)控制邏輯生成對(duì)應(yīng)的控制指令;
7、s4、在各個(gè)藍(lán)牙m(xù)esh設(shè)備之間建立藍(lán)牙m(xù)esh組網(wǎng),將所述控制指令發(fā)送至目標(biāo)設(shè)備的藍(lán)牙m(xù)esh接收器,所述目標(biāo)設(shè)備接收到所述控制指令后調(diào)用對(duì)應(yīng)的控制接口和驅(qū)動(dòng)程序?qū)ο鄳?yīng)的智能設(shè)備進(jìn)行控制操作。
8、進(jìn)一步地,所述預(yù)處理包括降噪、去回聲和語(yǔ)音增強(qiáng);
9、所述降噪為通過(guò)自適應(yīng)濾波算法,根據(jù)環(huán)境噪聲的變化實(shí)時(shí)調(diào)整濾波器參數(shù)。
10、進(jìn)一步地,利用預(yù)先本地部署的語(yǔ)音識(shí)別模型對(duì)所述第二語(yǔ)音信號(hào)進(jìn)行識(shí)別,將音頻文件轉(zhuǎn)換為文本指令,包括:
11、將語(yǔ)音識(shí)別模型部署在本地并獲取大量音頻訓(xùn)練數(shù)據(jù);
12、利用深度學(xué)習(xí)算法和音頻訓(xùn)練數(shù)據(jù)對(duì)所述語(yǔ)音識(shí)別模型進(jìn)行訓(xùn)練,調(diào)整模型結(jié)構(gòu)和參數(shù),獲得訓(xùn)練完成的語(yǔ)音識(shí)別模型;
13、利用訓(xùn)練完成的語(yǔ)音識(shí)別模型對(duì)所述第二語(yǔ)音信號(hào)進(jìn)行識(shí)別,將音頻文件轉(zhuǎn)換為文本指令。
14、進(jìn)一步地,所述音頻訓(xùn)練數(shù)據(jù)中包括不同口音、語(yǔ)速、語(yǔ)言習(xí)慣音頻數(shù)據(jù)以及各種常見(jiàn)的控制指令數(shù)據(jù)。
15、進(jìn)一步地,在各個(gè)藍(lán)牙m(xù)esh設(shè)備之間建立藍(lán)牙m(xù)esh組網(wǎng),包括:
16、利用藍(lán)牙m(xù)esh協(xié)議棧實(shí)現(xiàn)各個(gè)設(shè)備之間的多跳通信和網(wǎng)絡(luò)自組織,所述藍(lán)牙m(xù)esh組網(wǎng)為分布式組網(wǎng)。
17、進(jìn)一步地,所述方法還包括:
18、當(dāng)需要添加新的設(shè)備時(shí),將新設(shè)備的藍(lán)牙m(xù)esh單元加入至藍(lán)牙m(xù)esh組網(wǎng)中,所述藍(lán)牙m(xù)esh組網(wǎng)中的其他設(shè)備將該新設(shè)備納入控制范圍。
19、進(jìn)一步地,所述方法還包括:
20、實(shí)時(shí)獲取目標(biāo)設(shè)備的控制狀態(tài)和運(yùn)行信息;
21、將所述控制狀態(tài)和運(yùn)行信息實(shí)時(shí)反饋至用戶(hù)終端。
22、進(jìn)一步地,所述方法還包括:
23、獲取來(lái)自用戶(hù)的使用情況數(shù)據(jù)并定期收集新的音頻訓(xùn)練數(shù)據(jù)對(duì)所述語(yǔ)音識(shí)別模型進(jìn)行更新和優(yōu)化,定期對(duì)各個(gè)設(shè)備進(jìn)行檢查和維護(hù)。
24、進(jìn)一步地,所述方法還包括:當(dāng)設(shè)備出現(xiàn)故障或通信連接異常時(shí),發(fā)送警報(bào)至用戶(hù)終端,提醒用戶(hù)進(jìn)行處理。
25、根據(jù)本發(fā)明實(shí)施例的第二方面,提供了一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制系統(tǒng),所述系統(tǒng)包括:
26、語(yǔ)音采集與預(yù)處理模塊,用于采集來(lái)自用戶(hù)的第一語(yǔ)音信號(hào),并對(duì)采集到的第一語(yǔ)音信號(hào)進(jìn)行預(yù)處理,形成第二語(yǔ)音信號(hào);
27、離線語(yǔ)音識(shí)別引擎,用于利用預(yù)先本地部署的語(yǔ)音識(shí)別模型對(duì)所述第二語(yǔ)音信號(hào)進(jìn)行識(shí)別,將音頻文件轉(zhuǎn)換為文本指令;
28、指令解析與處理模塊,用于獲取所述文本指令并對(duì)所述文本指令進(jìn)行解析和語(yǔ)義理解,提取控制信息并根據(jù)預(yù)設(shè)控制邏輯生成對(duì)應(yīng)的控制指令;
29、藍(lán)牙m(xù)esh通信模塊,用于在各個(gè)藍(lán)牙m(xù)esh設(shè)備之間建立藍(lán)牙m(xù)esh組網(wǎng),將所述控制指令發(fā)送至目標(biāo)設(shè)備的藍(lán)牙m(xù)esh接收器;
30、設(shè)備控制模塊,用于所述目標(biāo)設(shè)備接收到所述控制指令后調(diào)用對(duì)應(yīng)的控制接口和驅(qū)動(dòng)程序?qū)ο鄳?yīng)的智能設(shè)備進(jìn)行控制操作。
31、本發(fā)明實(shí)施例具有如下優(yōu)點(diǎn):
32、本發(fā)明實(shí)施例包括:s1、采集來(lái)自用戶(hù)的第一語(yǔ)音信號(hào),并對(duì)采集到的第一語(yǔ)音信號(hào)進(jìn)行預(yù)處理,形成第二語(yǔ)音信號(hào);s2、利用預(yù)先本地部署的語(yǔ)音識(shí)別模型對(duì)所述第二語(yǔ)音信號(hào)進(jìn)行識(shí)別,將音頻文件轉(zhuǎn)換為文本指令;s3、獲取所述文本指令并對(duì)所述文本指令進(jìn)行解析和語(yǔ)義理解,提取控制信息并根據(jù)預(yù)設(shè)控制邏輯生成對(duì)應(yīng)的控制指令;s4、在各個(gè)藍(lán)牙m(xù)esh設(shè)備之間建立藍(lán)牙m(xù)esh組網(wǎng),將所述控制指令發(fā)送至目標(biāo)設(shè)備的藍(lán)牙m(xù)esh接收器,所述目標(biāo)設(shè)備接收到所述控制指令后調(diào)用對(duì)應(yīng)的控制接口和驅(qū)動(dòng)程序?qū)ο鄳?yīng)的智能設(shè)備進(jìn)行控制操作。本發(fā)明實(shí)施例能夠在無(wú)需網(wǎng)絡(luò)連接的情況下,實(shí)現(xiàn)對(duì)多個(gè)智能設(shè)備的精準(zhǔn)語(yǔ)音控制,同時(shí)利用藍(lán)牙m(xù)esh技術(shù)的優(yōu)勢(shì),實(shí)現(xiàn)設(shè)備的大規(guī)模組網(wǎng)和靈活擴(kuò)展,提高系統(tǒng)的可靠性和穩(wěn)定性,保障用戶(hù)的隱私安全。
1.一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,所述預(yù)處理包括降噪、去回聲和語(yǔ)音增強(qiáng);
3.如權(quán)利要求2所述的一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,利用預(yù)先本地部署的語(yǔ)音識(shí)別模型對(duì)所述第二語(yǔ)音信號(hào)進(jìn)行識(shí)別,將音頻文件轉(zhuǎn)換為文本指令,包括:
4.如權(quán)利要求3所述的一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,所述音頻訓(xùn)練數(shù)據(jù)中包括不同口音、語(yǔ)速、語(yǔ)言習(xí)慣音頻數(shù)據(jù)以及各種常見(jiàn)的控制指令數(shù)據(jù)。
5.如權(quán)利要求4所述的一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,在各個(gè)藍(lán)牙m(xù)esh設(shè)備之間建立藍(lán)牙m(xù)esh組網(wǎng),包括:
6.如權(quán)利要求5所述的一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,所述方法還包括:
7.如權(quán)利要求6所述的一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,所述方法還包括:
8.如權(quán)利要求7所述的一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,所述方法還包括:
9.如權(quán)利要求8所述的一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制方法,其特征在于,所述方法還包括:當(dāng)設(shè)備出現(xiàn)故障或通信連接異常時(shí),發(fā)送警報(bào)至用戶(hù)終端,提醒用戶(hù)進(jìn)行處理。
10.一種基于藍(lán)牙m(xù)esh的離線語(yǔ)音識(shí)別控制系統(tǒng),其特征在于,所述系統(tǒng)包括: