本申請涉及計算機,尤其涉及一種語音識別方法及相關設備。
背景技術:
1、目前,在當今數(shù)字化高速發(fā)展的時代,語音識別技術在地圖導航服務中的應用愈發(fā)重要。然而,現(xiàn)有的語音識別系統(tǒng)在處理地圖poi(興趣點)時,面臨著諸多嚴峻的問題和顯著的不足。全國各地的poi數(shù)據(jù)規(guī)模龐大,達到了數(shù)千萬量級。如此海量的數(shù)據(jù)給語音識別系統(tǒng)的處理和匹配帶來了巨大的挑戰(zhàn)。同時,中國地域遼闊,文化豐富,同音的地名眾多,這進一步增加了語音識別的難度。
2、然而,現(xiàn)有的語音識別系統(tǒng)通常僅僅依賴音頻數(shù)據(jù)來識別用戶的語音指令,而嚴重忽略了用戶的地理位置信息。這導致在面對同音或近音的地名時,識別結果往往極不準確,無法滿足用戶的實際需求。因此有必要提出一種語音識別方法,以至少解決上述部分問題。
技術實現(xiàn)思路
1、在
技術實現(xiàn)要素:
部分中引入了一系列簡化形式的概念,這將在具體實施方式部分中進一步詳細說明。本申請的發(fā)明內容部分并不意味著要試圖限定出所要求保護的技術方案的關鍵特征和必要技術特征,更不意味著試圖確定所要求保護的技術方案的保護范圍。
2、第一方面,本申請實施例提供一種語音識別方法,所述方法包括:
3、獲取用戶輸入的音頻數(shù)據(jù)和用戶車輛所在的位置信息;
4、若所述音頻數(shù)據(jù)屬于導航領域,將所述音頻數(shù)據(jù)與興趣點數(shù)據(jù)庫中的各個興趣點進行匹配,得到匹配結果;
5、若所述匹配結果中所包含的目標興趣點的數(shù)量大于第一預設數(shù)量,根據(jù)所述位置信息以及所述目標興趣點,確定所述音頻數(shù)據(jù)中的目標地點,其中,所述目標興趣點為與所述音頻數(shù)據(jù)相匹配的興趣點。
6、在本發(fā)明的一個實施例中,所述音頻數(shù)據(jù)與興趣點數(shù)據(jù)庫中的各個興趣點進行匹配,得到匹配結果之前,還包括:
7、對所述音頻數(shù)據(jù)進行語義分析,得到意圖信息;
8、獲取與所述意圖信息相關聯(lián)的多個初始功能領域,基于各個所述初始功能領域之間的關聯(lián)程度,確定所述音頻數(shù)據(jù)是否屬于導航領域。
9、在本發(fā)明的一個實施例中,所述根據(jù)所述位置信息以及所述目標興趣點,確定所述音頻數(shù)據(jù)中的目標地點的步驟包括:
10、確定多個目標興趣點中的第一興趣點,其中,第一興趣點對應的位置位于用戶所屬城市;
11、基于所述第一興趣點確定目標地點。
12、在本發(fā)明的一個實施例中,所述根據(jù)所述位置信息以及所述目標興趣點,確定所述音頻數(shù)據(jù)中的目標地點的步驟還包括:
13、若不存在所述第一興趣點,計算所述位置信息與多個所述目標興趣點對應的位置之間的實際距離;
14、將所述實際距離最近的目標興趣點,作為目標地點。
15、在本發(fā)明的一個實施例中,所述基于所述第一興趣點確定目標地點的步驟包括:
16、若存在一個所述第一興趣點,將所述第一興趣點對應的位置作為目標地點;
17、若存在至少兩個第一興趣點,獲取所述匹配結果的回流用戶數(shù)據(jù)、知名度和用戶歷史記錄;
18、對所述回流用戶數(shù)據(jù)、所述知名度和所述用戶歷史記錄進行熱度值累積和計算,得到熱度值;
19、選取熱度值最高的所述第一興趣點對應的位置,作為目標地點。
20、在本發(fā)明的一個實施例中,所述將所述音頻數(shù)據(jù)與興趣點數(shù)據(jù)庫中的各個興趣點進行匹配,得到匹配結果之前的步驟還包括:
21、確定與位置信息相關聯(lián)的城市;
22、從多個候選興趣點數(shù)據(jù)庫中,確定與所述城市對應的興趣點數(shù)據(jù)庫。
23、在本發(fā)明的一個實施例中,若所述匹配結果中所包含的目標興趣點的數(shù)量小于第二預設數(shù)量,所述方法還包括:
24、在所述匹配結果中所包含的目標興趣點的數(shù)量小于第二預設數(shù)量的情況下,對所述興趣點數(shù)據(jù)庫進行更新,并重復執(zhí)行將所述音頻數(shù)據(jù)與興趣點數(shù)據(jù)庫中的各個興趣點進行匹配,得到匹配結果的步驟,其中,所述第二預設數(shù)量小于等于所述第一預設數(shù)量。
25、第二方面、本申請?zhí)岢鲆环N語音識別系統(tǒng),所述系統(tǒng)包括:數(shù)據(jù)獲取模塊、匹配模塊和識別模塊;
26、所述數(shù)據(jù)獲取模塊被配置為:獲取用戶輸入的音頻數(shù)據(jù)和用戶車輛所在的位置信息;
27、所述匹配模塊被配置為:若所述音頻數(shù)據(jù)屬于導航領域,將所述音頻數(shù)據(jù)與興趣點數(shù)據(jù)庫中的各個興趣點進行匹配,得到匹配結果;
28、所述識別模塊被配置為:若所述匹配結果中所包含的目標興趣點的數(shù)量大于第一預設數(shù)量,根據(jù)所述位置信息以及所述目標興趣點,確定所述音頻數(shù)據(jù)中的目標地點,其中,所述目標興趣點為與所述音頻數(shù)據(jù)相匹配的興趣點。
29、第三方面,一種電子設備,包括:存儲器、處理器以及存儲在上述存儲器中并可在上述處理器上運行的計算機程序,上述處理器用于執(zhí)行存儲器中存儲的計算機程序時實現(xiàn)如上述的第一方面任一項的一種語音識別方法的步驟。
30、第四方面,本申請還提出一種計算機可讀存儲介質,其上存儲有計算機程序,上述計算機程序被處理器執(zhí)行時實現(xiàn)第一方面任一項的一種語音識別方法的步驟。
31、綜上,本申請實施例的一種語音識別方法,通過位置信息以及目標興趣點,確定所述音頻數(shù)據(jù)中的目標地點,有效避免了同音或近音地名的混淆,使得識別結果更貼合用戶的實際需求和所處位置,減少了因識別錯誤導致的導航錯誤和搜索失誤,進而提高了識別結果的準確性,更好的滿足了用戶的實際需求。
32、本申請?zhí)岢龅恼Z音識別方法,本申請的其它優(yōu)點、目標和特征將部分通過下面的說明體現(xiàn),部分還將通過對本申請的研究和實踐而為本領域的技術人員所理解。
1.一種語音識別方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的語音識別方法,其特征在于,所述音頻數(shù)據(jù)與興趣點數(shù)據(jù)庫中的各個興趣點進行匹配,得到匹配結果之前,還包括:
3.根據(jù)權利要求1所述的語音識別方法,其特征在于,所述根據(jù)所述位置信息以及所述目標興趣點,確定所述音頻數(shù)據(jù)中的目標地點的步驟包括:
4.根據(jù)權利要求3所述的語音識別方法,其特征在于,所述根據(jù)所述位置信息以及所述目標興趣點,確定所述音頻數(shù)據(jù)中的目標地點的步驟還包括:
5.根據(jù)權利要求3所述的語音識別方法,其特征在于,所述基于所述第一興趣點確定目標地點的步驟包括:
6.根據(jù)權利要求1所述的語音識別方法,其特征在于,所述將所述音頻數(shù)據(jù)與興趣點數(shù)據(jù)庫中的各個興趣點進行匹配,得到匹配結果之前的步驟還包括:
7.根據(jù)權利要求1所述的語音識別方法,其特征在于,若所述匹配結果中所包含的目標興趣點的數(shù)量小于第二預設數(shù)量,所述方法還包括:
8.一種語音識別系統(tǒng),其特征在于,所述系統(tǒng)包括:數(shù)據(jù)獲取模塊、匹配模塊和識別模塊;
9.一種電子設備,包括:存儲器和處理器,其特征在于,所述處理器用于執(zhí)行存儲器中存儲的計算機程序時實現(xiàn)如權利要求1-7中任一項所述的一種語音識別方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1-7中任一項所述的一種語音識別方法的步驟。