本發(fā)明涉及電力系統(tǒng)自動化,特別是涉及一種用于電力安全系統(tǒng)的語音識別處理方法及系統(tǒng)。
背景技術:
1、隨著計算機技術和人工智能的不斷發(fā)展,以及人們生活需求不斷提高,在很多場景中需要進行智能化語音識別,例如,語音消息的文本轉換場景、智能語音交通場景、虛擬機器人交互場景等,并能將這些場景投入至傳統(tǒng)技術產業(yè)以及高新技術產業(yè),如電力系統(tǒng)、語音識別系統(tǒng)等。此外,隨著自然語言理解不斷取得進展,語音識別處理技術已成為一個越來越廣泛的應用方向,例如,結合語音識別處理技術將電力系統(tǒng)智能化,能夠更好地為工作人員以及服務對象提供更為便捷、高效的服務。
2、目前,傳統(tǒng)語音識別處理技術將電力安全系統(tǒng)智能化,一般是通過接收用戶輸入的語音信息,使用非自回歸語音識別模型對語音信息進行語音識別獲得語音識別結果,基于語音識別結果執(zhí)行相應的操作。雖然非自回歸語音識別模型由于語音識別速度快等優(yōu)勢,獲得了廣泛的應用,但是,非自回歸語音識別模型,僅利用了語音信息在語音層次上的局部信息,存在較大識別誤差,從而導致識別準確率低的缺點,以及降低電力系統(tǒng)智能化效果。
技術實現思路
1、本發(fā)明的目的在于,提出一種于電力安全系統(tǒng)的語音識別處理方法及系統(tǒng),解決如何實現降低語音識別識別誤差進而提高準確性的技術問題。
2、一方面,提供一種用于電力安全系統(tǒng)的語音識別處理方法,包括:
3、獲取咨詢對象的原始語音數據,并根據該原始語音數據生成對應的原始語音文本;
4、按照對應的電力業(yè)務生成規(guī)則,生成與所述原始語音文本對應的電力業(yè)務信息文本;其中,所述電力業(yè)務生成規(guī)則為通過所述原始語音文本獲取的對應的電力業(yè)務標識,并根據該電力業(yè)務標識進行確定的目標電力業(yè)務生成規(guī)則;
5、將所述電力業(yè)務信息文本通過預設的轉化方式轉換為對應的目標電力業(yè)務提示語音,并將播報給所述咨詢對象。
6、優(yōu)選地,所述根據該原始語音數據生成對應的原始語音文本包括,將所述原始語音數據輸入預設的語音識別模型,通過所述語音識別模型識別出原始語音數據對應的語音文本單元以及所述語音文本單元對應的文本概率分布;
7、通過所述語音文本單元對應的文本概率分布以及預設的詞表確定每個語音文本單元對應的詞語,并將所有的詞語組合成對應的原始語音文本。
8、優(yōu)選地,所述語音識別模型通過以下步驟獲得,將樣本語音數據輸入預設的基礎語音識別模型,通過所述基礎語音識別模型中的聲學網絡,獲取所述樣本語音數據對應的樣本語音向量、對應的樣本文本單元以及每個所述樣本文本單元對應的基礎文本概率分布;
9、基于每個所述樣本文本單元、每個所述樣本文本單元對應的基礎文本概率分布以及文本單元標簽計算對應的文本識別損失值;
10、基于所述文本識別損失值更新所述基礎語音識別模型的參數,直至所述基礎語音識別模型的精度達到預設的閾值為止,將此時的所述基礎語音識別模型輸出為語音識別模型。
11、優(yōu)選地,所述通過所述原始語音文本獲取的對應的電力業(yè)務標識包括,將所述原始語音文本輸入預設的業(yè)務判別模型,得到每種電力業(yè)務的基礎業(yè)務得分;
12、將每種電力業(yè)務的基礎業(yè)務得分按照預設的業(yè)務權重系數進行計算,得到每種電力業(yè)務對應的綜合業(yè)務得分;
13、將最大的綜合業(yè)務得分對應的電力業(yè)務的預設標識輸出為電力業(yè)務標識。
14、優(yōu)選地,所述業(yè)務判別模型通過以下步驟獲得,將樣本語音文本輸入預設的基礎業(yè)務判別模型,確定每個所述樣本語音文本對應的業(yè)務判別概率;
15、根據每個所述樣本語音文本對應的業(yè)務判別概率以及預設的業(yè)務信息標簽計算業(yè)務判別損失值;
16、基于所述業(yè)務判別損失值更新所述基礎業(yè)務判別模型的參數,直至所述基礎業(yè)務判別模型的精度達到預設的閾值為止,將此時的所述基礎業(yè)務判別模型輸出為業(yè)務判別模型。
17、優(yōu)選地,所述生成與所述原始語音文本對應的電力業(yè)務信息文本包括,獲取所述原始語音數據對應的咨詢對象標識,并根據該資源對象標識確定咨詢對象編號信息;
18、根據所述原始語音文本以及所述咨詢對象編號信息,按照所述電力業(yè)務生成規(guī)則,生成對應的電力業(yè)務信息文本。
19、優(yōu)選地,所述根據該資源對象標識確定咨詢對象編號信息包括,若在信息數據庫中存在與所述資源對象標識相關聯的編號信息,則將相關聯的編號信息輸出為咨詢對象編號信息;
20、若在信息數據庫中不存在與所述資源對象標識相關聯的編號信息,則按照預設的臨時信息模板為所述資源對象標識設置臨時編號信息,并將該臨時編號信息輸出為咨詢對象編號信息。
21、另一方面,還提供一種用于電力安全系統(tǒng)的語音識別處理系統(tǒng),用于實現所述的用于電力安全系統(tǒng)的語音識別處理方法,包括:
22、數據獲取模塊,用于獲取咨詢對象的原始語音數據,并根據該原始語音數據生成對應的原始語音文本;
23、文本生成模塊,用于按照對應的電力業(yè)務生成規(guī)則,生成與所述原始語音文本對應的電力業(yè)務信息文本;其中,所述電力業(yè)務生成規(guī)則為通過所述原始語音文本獲取的對應的電力業(yè)務標識,并根據該電力業(yè)務標識進行確定的目標電力業(yè)務生成規(guī)則;
24、信息提示模塊,用于將所述電力業(yè)務信息文本通過預設的轉化方式轉換為對應的目標電力業(yè)務提示語音,并將播報給所述咨詢對象。
25、優(yōu)選地,所述數據獲取模塊還用于,將所述原始語音數據輸入預設的語音識別模型,通過所述語音識別模型識別出原始語音數據對應的語音文本單元以及所述語音文本單元對應的文本概率分布;
26、通過所述語音文本單元對應的文本概率分布以及預設的詞表確定每個語音文本單元對應的詞語,并將所有的詞語組合成對應的原始語音文本。
27、優(yōu)選地,所述文本生成模塊還用于,將所述原始語音文本輸入預設的業(yè)務判別模型,得到每種電力業(yè)務的基礎業(yè)務得分;
28、將每種電力業(yè)務的基礎業(yè)務得分按照預設的業(yè)務權重系數進行計算,得到每種電力業(yè)務對應的綜合業(yè)務得分;
29、將最大的綜合業(yè)務得分對應的電力業(yè)務的預設標識輸出為電力業(yè)務標識;
30、獲取所述原始語音數據對應的咨詢對象標識,并根據該資源對象標識確定咨詢對象編號信息;其中,若在信息數據庫中存在與所述資源對象標識相關聯的編號信息,則將相關聯的編號信息輸出為咨詢對象編號信息;若在信息數據庫中不存在與所述資源對象標識相關聯的編號信息,則按照預設的臨時信息模板為所述資源對象標識設置臨時編號信息,并將該臨時編號信息輸出為咨詢對象編號信息;
31、根據所述原始語音文本以及所述咨詢對象編號信息,按照所述電力業(yè)務生成規(guī)則,生成對應的電力業(yè)務信息文本。
32、綜上,實施本發(fā)明的實施例,具有如下的有益效果:
33、本發(fā)明提供的用于電力安全系統(tǒng)的語音識別處理方法及系統(tǒng),不僅能夠提高語音識別的準確性和語音識別效率,還能夠提高幫助咨詢對象及時準確地進行信息獲取,從而在一定程度上提高電力安全系統(tǒng)的智能化效果。