本發(fā)明涉及語音識別與應(yīng)用交互,更具體地說,涉及一種基于智能座艙應(yīng)用的可見即可說的通信方法與系統(tǒng)。
背景技術(shù):
1、在現(xiàn)代汽車和其他交通工具的發(fā)展中,智能座艙已逐漸成為熱點(diǎn)。隨著車載信息娛樂系統(tǒng)的復(fù)雜度和多功能性的增加,用戶交互方式也在不斷發(fā)展。傳統(tǒng)的物理按鍵和觸摸屏操作在某些情況下可能會分散駕駛員的注意力,從而影響駕駛安全。因此,語音識別和語音控制技術(shù)在智能座艙中的應(yīng)用變得越來越重要?!翱梢娂纯烧f”作為一種語音交互方法,允許用戶直接說出他們在屏幕上看到的選項(xiàng)或控件,從而實(shí)現(xiàn)與系統(tǒng)的交互。這種方法簡化了語音識別過程,提高了識別的準(zhǔn)確性,并為駕駛員提供了一個更加直觀和自然的交互方式。然而,實(shí)現(xiàn)這一功能需要在軟件和硬件層面上解決多個技術(shù)挑戰(zhàn),例如:如何準(zhǔn)確地識別和注冊屏幕上的控件、如何在云端高效地處理和匹配語音指令、如何在本地實(shí)時響應(yīng)用戶的語音指令等。在諸多問題和挑戰(zhàn)中,多屏焦點(diǎn)的不準(zhǔn)確性又是一個較難解決的問題。在多屏配置中,用戶的注意力可能會被多個屏幕上的內(nèi)容所吸引,而現(xiàn)有的語音識別技術(shù)很難確定用戶當(dāng)前關(guān)注的是哪一個屏幕,從而導(dǎo)致語音控制的焦點(diǎn)不準(zhǔn),無法滿足現(xiàn)代駕駛員在駕駛過程中對快速、準(zhǔn)確的語音控制的需求。再者,現(xiàn)有的語音識別技術(shù)往往需要用戶記住特定的指令或關(guān)鍵詞,對于日常使用而言并不直觀,也不容易上手。
2、綜上所述,現(xiàn)有的語音識別技術(shù)在面臨多屏配置的智能座艙時,存在語音控制的焦點(diǎn)不準(zhǔn),無法滿足現(xiàn)代駕駛員在駕駛過程中對快速、準(zhǔn)確的語音控制的需求,對于日常使用而言并不直觀,也不容易上手等技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明要解決的技術(shù)問題在于,針對上述技術(shù)方案存在的不足,提供一種基于智能座艙應(yīng)用的可見即可說的通信方法與系統(tǒng),以實(shí)現(xiàn)在多屏配置的智能座艙中準(zhǔn)確聚焦語音控制,滿足現(xiàn)代駕駛員在駕駛過程中對快速、準(zhǔn)確的語音控制的需求,使日常使用直觀,容易上手。
2、第一方面,本發(fā)明提供一種基于智能座艙應(yīng)用的可見即可說的通信方法,包括以下步驟:
3、配置具備語音交互內(nèi)容的sdk模塊,利用所述sdk模塊對智能座艙中不同的業(yè)務(wù)端應(yīng)用的控件進(jìn)行注冊,以使所述sdk模塊集成到智能座艙中不同的業(yè)務(wù)端應(yīng)用,讓所述業(yè)務(wù)端應(yīng)用獲得語音交互功能;
4、在所述業(yè)務(wù)端應(yīng)用啟動時,通過所述sdk模塊監(jiān)聽所述業(yè)務(wù)端應(yīng)用,以掃描所述業(yè)務(wù)端應(yīng)用的界面控件,得到控件信息,所述控件信息具有唯一標(biāo)識碼,所述唯一標(biāo)識碼用于標(biāo)識智能座艙中具體屏幕的界面控件;
5、將所述控件信息傳輸給語音端,所述語音端對所述控件信息進(jìn)行熱詞注冊處理,以將所述控件信息轉(zhuǎn)化為熱詞,上傳云端;
6、在所述語音端接收到針對所述業(yè)務(wù)端應(yīng)用的語音命令時,所述語音端將所述語音命令傳輸至所述云端,所述云端將與所述語音命令匹配的熱詞返回所述語音端;所述語音端根據(jù)返回的熱詞進(jìn)行控件信息匹配,并將匹配到的控件信息返回給所述業(yè)務(wù)端應(yīng)用,以控制所述具體屏幕的界面控件。
7、進(jìn)一步,配置具備語音交互內(nèi)容的sdk模塊,利用所述sdk模塊對智能座艙中不同的業(yè)務(wù)端應(yīng)用的控件進(jìn)行注冊,以使所述sdk模塊集成到智能座艙中不同的業(yè)務(wù)端應(yīng)用,讓所述業(yè)務(wù)端應(yīng)用獲得語音交互功能,包括:
8、配置sdk模塊,所述sdk模塊包括多個字段的json數(shù)據(jù),所述多個字段的json數(shù)據(jù)描述了智能座艙中不同的業(yè)務(wù)端應(yīng)用的控件特點(diǎn)和預(yù)期的語音互動行為;
9、利用所述多個字段的json數(shù)據(jù)對智能座艙中不同的業(yè)務(wù)端應(yīng)用的控件進(jìn)行注冊,以使所述業(yè)務(wù)端應(yīng)用的控件包含所述多個字段的json數(shù)據(jù),實(shí)現(xiàn)所述sdk模塊集成到智能座艙中不同的業(yè)務(wù)端應(yīng)用,讓所述業(yè)務(wù)端應(yīng)用獲得語音交互功能。
10、進(jìn)一步,利用所述多個字段的json數(shù)據(jù)對智能座艙中不同的業(yè)務(wù)端應(yīng)用的控件進(jìn)行注冊時,采用多種注冊方式,不同的注冊方式對應(yīng)所述多個字段的json數(shù)據(jù)中不同字段的json數(shù)據(jù)。
11、進(jìn)一步,所述多種注冊方式包括原字段注冊機(jī)制,所述原字段注冊機(jī)制允許所述業(yè)務(wù)端應(yīng)用的開發(fā)者為特定的界面控件注冊確切的熱詞,確保語音助手只響應(yīng)與注冊文本完全匹配的語音命令。
12、進(jìn)一步,所述多種注冊方式包括開關(guān)類型文本注冊機(jī)制;所述開關(guān)類型文本注冊機(jī)制為開關(guān)類控件提供注冊,根據(jù)控件的狀態(tài)自動產(chǎn)生相應(yīng)的語音命令。
13、進(jìn)一步,所述多種注冊方式包括正則文本注冊機(jī)制,所述正則文本注冊機(jī)制允許所述業(yè)務(wù)端應(yīng)用的開發(fā)者為界面控件注冊包含正則表達(dá)式的熱詞,使語音助手能識別并響應(yīng)多種變體的語音命令。
14、進(jìn)一步,所述多種注冊方式包括列表數(shù)字文本注冊機(jī)制,所述列表數(shù)字文本注冊機(jī)制用于列表類控件注冊,使所述列表類控件能響應(yīng)與列表項(xiàng)位置相關(guān)的語音命令。
15、進(jìn)一步,所述多種注冊方式包括列表文本分詞注冊機(jī)制,所述列表文本分詞注冊機(jī)制為復(fù)雜的列表類控件提供更細(xì)粒度的注冊方法。
16、進(jìn)一步,所述sdk模塊監(jiān)聽所述業(yè)務(wù)端應(yīng)用時,包括監(jiān)聽所述業(yè)務(wù)端應(yīng)用的應(yīng)用生命周期,以確認(rèn)所述業(yè)務(wù)端應(yīng)用的可見性;所述業(yè)務(wù)端應(yīng)用處于可見狀態(tài)時,掃描所述業(yè)務(wù)端應(yīng)用的界面控件;所述sdk模塊監(jiān)聽所述業(yè)務(wù)端應(yīng)用時,還包括監(jiān)聽所述業(yè)務(wù)端應(yīng)用的界面變化。
17、第二方面,本發(fā)明提供一種基于智能座艙應(yīng)用的可見即可說的通信系統(tǒng),包括:
18、智能座艙,所述智能座艙包括語音端和業(yè)務(wù)端;
19、云端;所述云端與所述語音端通信連接,所述語音端與所述業(yè)務(wù)端通信連接,以運(yùn)行上述任一項(xiàng)所述的基于智能座艙應(yīng)用的可見即可說的通信方法。
20、本發(fā)明與現(xiàn)有技術(shù)相比,其有益效果如下:
21、本發(fā)明提供的基于智能座艙應(yīng)用的可見即可說的通信方法與系統(tǒng),通過配置具備語音交互內(nèi)容的sdk模塊,利用所述sdk模塊對智能座艙中不同的業(yè)務(wù)端應(yīng)用的控件進(jìn)行注冊,以使所述sdk模塊集成到智能座艙中不同的業(yè)務(wù)端應(yīng)用,讓所述業(yè)務(wù)端應(yīng)用獲得語音交互功能,在所述業(yè)務(wù)端應(yīng)用啟動時,通過所述sdk模塊監(jiān)聽所述業(yè)務(wù)端應(yīng)用,以掃描所述業(yè)務(wù)端應(yīng)用的界面控件,得到控件信息,所述控件信息具有唯一標(biāo)識碼,所述唯一標(biāo)識碼用于標(biāo)識智能座艙中具體屏幕的界面控件,將所述控件信息傳輸給語音端,所述語音端對所述控件信息進(jìn)行熱詞注冊處理,以將所述控件信息轉(zhuǎn)化為熱詞,上傳云端,在所述語音端接收到針對所述業(yè)務(wù)端應(yīng)用的語音命令時,所述語音端將所述語音命令傳輸至所述云端,所述云端將與所述語音命令匹配的熱詞返回所述語音端,所述語音端根據(jù)返回的熱詞進(jìn)行控件信息匹配,并將匹配到的控件信息返回給所述業(yè)務(wù)端應(yīng)用,以控制所述具體屏幕的界面控件,從而實(shí)現(xiàn)在多屏配置的智能座艙中準(zhǔn)確聚焦語音控制,滿足現(xiàn)代駕駛員在駕駛過程中對快速、準(zhǔn)確的語音控制的需求,使日常使用直觀,容易上手。
1.一種基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,配置具備語音交互內(nèi)容的sdk模塊,利用所述sdk模塊對智能座艙中不同的業(yè)務(wù)端應(yīng)用的控件進(jìn)行注冊,以使所述sdk模塊集成到智能座艙中不同的業(yè)務(wù)端應(yīng)用,讓所述業(yè)務(wù)端應(yīng)用獲得語音交互功能,包括:
3.如權(quán)利要求2所述的基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,利用所述多個字段的json數(shù)據(jù)對智能座艙中不同的業(yè)務(wù)端應(yīng)用的控件進(jìn)行注冊時,采用多種注冊方式,不同的注冊方式對應(yīng)所述多個字段的json數(shù)據(jù)中不同字段的json數(shù)據(jù)。
4.如權(quán)利要求3所述的基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,所述多種注冊方式包括原字段注冊機(jī)制,所述原字段注冊機(jī)制允許所述業(yè)務(wù)端應(yīng)用的開發(fā)者為特定的界面控件注冊確切的熱詞,確保語音助手只響應(yīng)與注冊文本完全匹配的語音命令。
5.如權(quán)利要求3所述的基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,所述多種注冊方式包括開關(guān)類型文本注冊機(jī)制;所述開關(guān)類型文本注冊機(jī)制為開關(guān)類控件提供注冊,根據(jù)控件的狀態(tài)自動產(chǎn)生相應(yīng)的語音命令。
6.如權(quán)利要求3所述的基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,所述多種注冊方式包括正則文本注冊機(jī)制,所述正則文本注冊機(jī)制允許所述業(yè)務(wù)端應(yīng)用的開發(fā)者為界面控件注冊包含正則表達(dá)式的熱詞,使語音助手能識別并響應(yīng)多種變體的語音命令。
7.如權(quán)利要求3所述的基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,所述多種注冊方式包括列表數(shù)字文本注冊機(jī)制,所述列表數(shù)字文本注冊機(jī)制用于列表類控件注冊,使所述列表類控件能響應(yīng)與列表項(xiàng)位置相關(guān)的語音命令。
8.如權(quán)利要求3所述的基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,所述多種注冊方式包括列表文本分詞注冊機(jī)制,所述列表文本分詞注冊機(jī)制為復(fù)雜的列表類控件提供更細(xì)粒度的注冊方法。
9.如權(quán)利要求1-8任一項(xiàng)所述的基于智能座艙應(yīng)用的可見即可說的通信方法,其特征在于,所述sdk模塊監(jiān)聽所述業(yè)務(wù)端應(yīng)用時,包括監(jiān)聽所述業(yè)務(wù)端應(yīng)用的應(yīng)用生命周期,以確認(rèn)所述業(yè)務(wù)端應(yīng)用的可見性;所述業(yè)務(wù)端應(yīng)用處于可見狀態(tài)時,掃描所述業(yè)務(wù)端應(yīng)用的界面控件;所述sdk模塊監(jiān)聽所述業(yè)務(wù)端應(yīng)用時,還包括監(jiān)聽所述業(yè)務(wù)端應(yīng)用的界面變化。
10.一種基于智能座艙應(yīng)用的可見即可說的通信系統(tǒng),其特征在于,包括: