本發(fā)明涉及耳機交互,特別涉及一種雙模耳機本地ai喚醒交互方法及系統(tǒng)。
背景技術(shù):
1、在當今數(shù)字化高速發(fā)展的時代,智能音頻設(shè)備深度融入人們的日常生活,其中耳機更是憑借其便捷性與功能性,一躍成為大眾不可或缺的貼身裝備。從清晨醒來時播放舒緩音樂喚醒活力,到通勤路上隔絕外界喧囂聆聽有聲讀物,再到工作學(xué)習(xí)時專注接聽語音會議,耳機在多種場景中發(fā)揮著關(guān)鍵作用。與此同時,人工智能技術(shù)以迅猛之勢蓬勃發(fā)展,為各領(lǐng)域帶來了顛覆性變革。這一變革浪潮也深刻影響著耳機領(lǐng)域,用戶不再滿足于耳機單純的音頻播放功能,對智能化交互功能的渴望與日俱增。然而,對于ai喚醒及功能實現(xiàn)仍存在諸多不足。
2、一方面,傳統(tǒng)的依賴云端服務(wù)器的ai喚醒方式,面臨著網(wǎng)絡(luò)延遲、不穩(wěn)定以及隱私安全等問題,在網(wǎng)絡(luò)信號不佳的環(huán)境下,喚醒響應(yīng)緩慢,甚至無法正常喚醒,極大地影響用戶體驗;
3、另一方面,本地ai喚醒雖然能一定程度上避免網(wǎng)絡(luò)問題,但現(xiàn)有本地ai喚醒技術(shù)往往在連接模式和數(shù)據(jù)傳輸方面存在缺陷,常見的耳機連接模式為藍牙,其傳輸帶寬有限,在處理大量ai相關(guān)數(shù)據(jù)時顯得力不從心,而且單一的藍牙連接模式難以滿足本地ai交互中對高效數(shù)據(jù)傳輸?shù)男枨?,例如在進行復(fù)雜的自然語言處理或圖像識別指令交互時,數(shù)據(jù)傳輸速度嚴重制約了ai功能的實現(xiàn)效率;
4、此外,現(xiàn)有的本地ai喚醒交互方法在不同連接模式切換時,容易出現(xiàn)喚醒中斷、數(shù)據(jù)傳輸異常等情況,無法為用戶提供穩(wěn)定、流暢的本地ai交互體驗;
5、為此,提出一種雙模耳機本地ai喚醒交互方法及系統(tǒng)。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明實施例希望提供一種雙模耳機本地ai喚醒交互方法及系統(tǒng),以解決或緩解現(xiàn)有技術(shù)中存在的技術(shù)問題,至少提供一種有益的選擇。
2、為解決上述技術(shù)問題,本技術(shù)采用的一個技術(shù)方案是:一種雙模耳機本地ai喚醒交互方法,包括以下步驟:
3、步驟一、耳機開機并進行初始化,基于藍牙低功耗技術(shù)與智能設(shè)備建立藍牙連接;
4、步驟二、基于耳機內(nèi)置的語音識別模塊,通過持續(xù)監(jiān)聽特定喚醒詞或操作指令獲取喚醒信號;
5、步驟三、對獲取的喚醒信號進行預(yù)處理,并通過藍牙模塊將預(yù)處理后的喚醒信號發(fā)送至智能設(shè)備;
6、步驟四、智能設(shè)備接收到來自耳機的喚醒信號后,對喚醒信號進行驗證,并向耳機反饋確認信息;
7、步驟五、耳機接收確認信息后,對喚醒信號進行加密壓縮處理,生成音頻數(shù)據(jù),并自動啟動wifi模塊與本地ai服務(wù)器建立連接,將音頻數(shù)據(jù)傳輸至本地ai服務(wù)器;
8、步驟六、本地ai服務(wù)器接收音頻數(shù)據(jù)后,基于算力和本地數(shù)據(jù)資源對接收的音頻數(shù)據(jù)進行分析處理,并生成處理結(jié)果;
9、步驟七、本地ai服務(wù)器將生成的處理結(jié)果回傳至耳機,耳機將處理結(jié)果以語音播報或可視化形式呈現(xiàn)給用戶。
10、提供作為本技術(shù)方案進一步優(yōu)選的,在步驟六中,所述生成處理結(jié)果的方法,包括以下步驟:
11、步驟601、對加密壓縮的音頻數(shù)據(jù)進行解壓縮和解密處理,還原為原始音頻信號;
12、步驟602、基于語音識別技術(shù)將音頻信號轉(zhuǎn)換為文本信息,并通過自然語言處理技術(shù)對文本信息進行分析,識別用戶指令類型;
13、步驟603、根據(jù)用戶指令類型,調(diào)用相應(yīng)的處理模塊和本地數(shù)據(jù)資源進行深度處理,并生成處理結(jié)果;
14、步驟604、根據(jù)耳機的顯示和語音播報能力,對處理結(jié)果進行格式化和優(yōu)化處理。
15、提供作為本技術(shù)方案進一步優(yōu)選的,在步驟二中,所述耳機內(nèi)置的語音識別模塊基于本地輕量級模型或云端輕量級模型運行,所述特定喚醒詞根據(jù)用戶自身需求設(shè)置。
16、提供作為本技術(shù)方案進一步優(yōu)選的,在步驟三中,所述對獲取的喚醒信號進行預(yù)處理的方法,包括以下步驟:
17、步驟301、將音頻形式的喚醒信號轉(zhuǎn)換為數(shù)字信號;
18、步驟302、基于降噪算法對數(shù)字信號進行降噪處理,去除環(huán)境噪聲干擾;
19、步驟303、對處理后的數(shù)字信號進行特征提取,提取與喚醒詞相關(guān)的關(guān)鍵特征。
20、提供作為本技術(shù)方案進一步優(yōu)選的,在步驟四中,所述智能設(shè)備預(yù)先存儲有與耳機約定的驗證密鑰和驗證規(guī)則;所述對喚醒信號進行驗證,通過將喚醒信號與預(yù)先存儲的驗證密鑰和驗證規(guī)則進行比對驗證;若比對結(jié)果相符,則判定喚醒信號驗證通過,向耳機反饋確認信息;若比對結(jié)果不符,則判定驗證失敗,不反饋確認信息,并可向耳機發(fā)送錯誤提示信息。
21、提供作為本技術(shù)方案進一步優(yōu)選的,在步驟五中,所述對喚醒信號進行加密壓縮處理時,采用aes算法和aac編碼對喚醒信號進行加密壓縮處理。
22、提供作為本技術(shù)方案進一步優(yōu)選的,所述用戶指令類型包括自然語言處理類指令;圖像識別類指令和多媒體控制類指令。
23、為解決上述技術(shù)問題,本技術(shù)采用的另一個技術(shù)方案是:一種雙模耳機本地ai喚醒交互系統(tǒng),所述系統(tǒng)包括:藍牙連接模塊、信號獲取模塊、信號預(yù)處理模塊、信號驗證模塊、數(shù)據(jù)生成與傳輸模塊、數(shù)據(jù)分析處理模塊和結(jié)果呈現(xiàn)模塊;
24、所述藍牙連接模塊,配置為耳機開機并進行初始化,基于藍牙低功耗技術(shù)與智能設(shè)備建立藍牙連接;
25、所述信號獲取模塊,配置為基于耳機內(nèi)置的語音識別模塊,通過持續(xù)監(jiān)聽特定喚醒詞或操作指令獲取喚醒信號;
26、所述信號預(yù)處理模塊,配置為對獲取的喚醒信號進行預(yù)處理,并通過藍牙模塊將預(yù)處理后的喚醒信號發(fā)送至智能設(shè)備;
27、所述信號驗證模塊,配置為智能設(shè)備接收到來自耳機的喚醒信號后,對喚醒信號進行驗證,并向耳機反饋確認信息;
28、所述數(shù)據(jù)生成與傳輸模塊,配置為耳機接收確認信息后,對喚醒信號進行加密壓縮處理,生成音頻數(shù)據(jù),并自動啟動wifi模塊與本地ai服務(wù)器建立連接,將音頻數(shù)據(jù)傳輸至本地ai服務(wù)器;
29、所述數(shù)據(jù)分析處理模塊,配置為本地ai服務(wù)器接收音頻數(shù)據(jù)后,基于算力和本地數(shù)據(jù)資源對接收的音頻數(shù)據(jù)進行分析處理,并生成處理結(jié)果;
30、所述結(jié)果呈現(xiàn)模塊,配置為本地ai服務(wù)器將生成的處理結(jié)果回傳至耳機,耳機將處理結(jié)果以語音播報或可視化形式呈現(xiàn)給用戶。
31、提供作為本技術(shù)方案進一步優(yōu)選的,所述系統(tǒng)還包括連接模式協(xié)同控制模塊,所述連接模式協(xié)同控制模塊用于實時監(jiān)測藍牙和wifi的連接狀態(tài),并記錄異常事件信息。
32、提供作為本技術(shù)方案進一步優(yōu)選的,所述數(shù)據(jù)生成與傳輸模塊在自動啟動wifi模塊與本地ai服務(wù)器建立連接時,具備智能網(wǎng)絡(luò)切換和優(yōu)化功能。
33、本發(fā)明實施例由于采用以上技術(shù)方案,其具有以下優(yōu)點:
34、1、本發(fā)明通過采用本地ai服務(wù)器進行數(shù)據(jù)處理,耳機接收確認信息后,自動啟動wifi模塊與本地ai服務(wù)器建立連接,將音頻數(shù)據(jù)傳輸至本地ai服務(wù)器,本地處理避免了因網(wǎng)絡(luò)不佳導(dǎo)致的喚醒問題,且無需將數(shù)據(jù)傳輸至云端,降低了隱私泄露風(fēng)險,有效解決了網(wǎng)絡(luò)相關(guān)的技術(shù)難題;
35、2、本發(fā)明通過采用藍牙低功耗技術(shù)與智能設(shè)備建立初始連接,用于傳輸簡單控制信令,在獲取喚醒信號并驗證后,通過wifi模塊與本地ai服務(wù)器連接傳輸數(shù)據(jù),wifi傳輸帶寬大,能夠滿足復(fù)雜指令交互時的數(shù)據(jù)傳輸要求,提升了數(shù)據(jù)傳輸效率,解決了連接模式和數(shù)據(jù)傳輸方面的問題;
36、3、本發(fā)明通過連接模式協(xié)同控制模塊實時監(jiān)測藍牙和wifi的連接狀態(tài),并具備智能網(wǎng)絡(luò)切換和優(yōu)化功能,確保了在連接模式切換或網(wǎng)絡(luò)出現(xiàn)波動時,自動采取相應(yīng)措施,避免喚醒中斷和數(shù)據(jù)傳輸異常,為用戶提供穩(wěn)定、流暢的本地ai交互體驗。
37、上述概述僅僅是為了說明書的目的,并不意圖以任何方式進行限制。除上述描述的示意性的方面、實施方式和特征之外,通過參考附圖和以下的詳細描述,本發(fā)明進一步的方面、實施方式和特征將會是容易明白的。