本技術(shù)涉及語音交互,特別涉及一種語音交互方法、服務(wù)器及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在相關(guān)技術(shù)中,拒識(shí)判斷通常是針對(duì)于音頻進(jìn)行,如通過語音活性檢測(cè)確定音頻中是否存在人聲以判斷是否拒識(shí)。然而如此,基于音頻進(jìn)行拒識(shí)判斷時(shí)可能忽略音頻模態(tài)中包含的語義等信息,進(jìn)而可能出現(xiàn)拒識(shí)判斷出錯(cuò)的情況,一定程度上影響人與機(jī)器間的語音交互效果。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供一種語音交互方法、服務(wù)器及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
2、本技術(shù)實(shí)施方式提供的一種語音交互方法,包括:
3、獲取當(dāng)前語音請(qǐng)求;
4、對(duì)所述當(dāng)前語音請(qǐng)求進(jìn)行自然語言處理,確定所述當(dāng)前語音請(qǐng)求對(duì)應(yīng)的目標(biāo)文本;
5、根據(jù)當(dāng)前語音請(qǐng)求與所述目標(biāo)文本,確定所述當(dāng)前語音請(qǐng)求與所述目標(biāo)文本的第一相似程度;
6、根據(jù)所述當(dāng)前語音請(qǐng)求、所述目標(biāo)文本及所述第一相似程度,確定所述當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果;
7、根據(jù)所述拒識(shí)結(jié)果進(jìn)行所述語音交互。
8、如此,在本技術(shù)實(shí)施方式中,可使當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果基于當(dāng)前語音請(qǐng)求本身和當(dāng)前語音請(qǐng)求對(duì)應(yīng)的目標(biāo)文本,以及當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本的第一相似程度來確定,從而實(shí)現(xiàn)多維度的拒識(shí)結(jié)果確定,故可在一定程度上保障當(dāng)前語音請(qǐng)求拒識(shí)結(jié)果的準(zhǔn)確與可靠,也因此,可保障基于拒識(shí)結(jié)果進(jìn)行的語音交互的穩(wěn)健與自然,從而可保障用戶與車輛等機(jī)器間的語音交互效果。以及,相比于通過當(dāng)前語音請(qǐng)求本身或當(dāng)前語音請(qǐng)求對(duì)應(yīng)的文本,確定當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果的方式而言,本技術(shù)實(shí)施方式基于當(dāng)前語音請(qǐng)求與當(dāng)前語音請(qǐng)求對(duì)應(yīng)的目標(biāo)文本間的第一相似程度,使得在確定當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果的過程中,能夠考慮到當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本之間的映射關(guān)系,故可進(jìn)一步保障拒識(shí)結(jié)果的有效與可靠。
9、在本技術(shù)某些實(shí)施方式中,所述根據(jù)當(dāng)前語音請(qǐng)求與所述目標(biāo)文本,確定所述當(dāng)前語音請(qǐng)求與所述目標(biāo)文本的第一相似程度,包括:
10、對(duì)所述當(dāng)前語音請(qǐng)求和所述目標(biāo)文本分別進(jìn)行編碼處理,確定所述當(dāng)前語音請(qǐng)求的第一編碼信息和所述目標(biāo)文本的第二編碼信息;
11、根據(jù)所述第一編碼信息與所述第二編碼信息,確定所述第一相似程度。
12、如此,在本技術(shù)實(shí)施方式中,可對(duì)當(dāng)前語音請(qǐng)求和目標(biāo)文本分別進(jìn)行編碼處理,確定當(dāng)前語音請(qǐng)求的第一編碼信息和目標(biāo)文本的第二編碼信息,及根據(jù)第一編碼信息與第二編碼信息確定當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本之間的相似程,使得第一相似程度可基于編碼當(dāng)前語音請(qǐng)求所確定的第一編碼信息、編碼目標(biāo)文本所確定的第二編碼信息確定,相比于直接計(jì)算當(dāng)前語音請(qǐng)求和目標(biāo)文本之間的相似度以確定第一相似程度的方式而言,能夠相對(duì)較快的效率完成第一相似程度的確定,從而可保障拒識(shí)結(jié)果的高效確定,進(jìn)而保障語音交互的及時(shí)與自然。
13、在本技術(shù)某些實(shí)施方式中,所述根據(jù)所述當(dāng)前語音請(qǐng)求、所述目標(biāo)文本及所述第一相似程度,確定所述當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果,包括:
14、在所述第一相似程度小于或等于第一預(yù)設(shè)相似度閾值的情況下,確定所述拒識(shí)結(jié)果為拒識(shí)。
15、如此,在本技術(shù)實(shí)施方式中,可在當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本的第一相似程度小于或等于第一預(yù)設(shè)相似度閾值的情況下,確定當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果為拒識(shí),由此實(shí)現(xiàn)當(dāng)前語音請(qǐng)求拒識(shí)結(jié)果的確定。
16、在本技術(shù)某些實(shí)施方式中,所述根據(jù)所述當(dāng)前語音請(qǐng)求、所述目標(biāo)文本及所述第一相似程度,確定所述當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果,包括:
17、在所述第一相似程度大于第二預(yù)設(shè)相似度閾值的情況下,根據(jù)所述當(dāng)前語音請(qǐng)求和/或所述目標(biāo)文本,確定所述拒識(shí)結(jié)果。
18、如此,在本技術(shù)實(shí)施方式中,可在當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本的第一相似程度大于第二預(yù)設(shè)相似度閾值的情況下,根據(jù)當(dāng)前語音請(qǐng)求和/或當(dāng)前語音請(qǐng)求對(duì)應(yīng)的目標(biāo)文本,確定當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果,由此保障當(dāng)前語音請(qǐng)求拒識(shí)結(jié)果的高效確定。
19、在本技術(shù)某些實(shí)施方式中,所述在所述第一相似程度大于第二預(yù)設(shè)相似度閾值的情況下,根據(jù)所述當(dāng)前語音請(qǐng)求和/或所述目標(biāo)文本,確定所述拒識(shí)結(jié)果,包括:
20、在所述第一相似程度大于第二預(yù)設(shè)相似度閾值的情況下,根據(jù)所述當(dāng)前語音請(qǐng)求的音頻特征和/或所述目標(biāo)文本的語義,確定所述拒識(shí)結(jié)果。
21、如此,在本技術(shù)實(shí)施方式中,可在當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本的第一相似程度大于第二預(yù)設(shè)相似度閾值的情況下,根據(jù)當(dāng)前語音請(qǐng)求的音頻特征和/或目標(biāo)文本的語義,確定當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果,由此保障當(dāng)前語音請(qǐng)求拒識(shí)結(jié)果的有效與可靠。
22、在本技術(shù)某些實(shí)施方式中,所述根據(jù)所述當(dāng)前語音請(qǐng)求、所述目標(biāo)文本及所述第一相似程度,確定所述當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果,包括:
23、基于預(yù)先訓(xùn)練完成的自然語言處理模型,根據(jù)所述當(dāng)前語音請(qǐng)求、所述目標(biāo)文本及所述第一相似程度,確定所述拒識(shí)結(jié)果。
24、如此,在本技術(shù)實(shí)施方式中,可基于預(yù)先訓(xùn)練完成的自然語言處理模型,根據(jù)當(dāng)前語音請(qǐng)求、目標(biāo)文本及當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本的確定當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果,使得當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果可基于自然語言處理模型確定,從而可保障當(dāng)前語音請(qǐng)求拒識(shí)結(jié)果的有效與可靠。
25、在本技術(shù)某些實(shí)施方式中,所述自然語言處理模型的訓(xùn)練步驟包括:
26、獲取語音請(qǐng)求樣本及所述語音請(qǐng)求樣本的文本標(biāo)簽;
27、根據(jù)所述語音請(qǐng)求樣本與所述文本標(biāo)簽,確定所述語音請(qǐng)求樣本與所述文本標(biāo)簽的第二相似程度;
28、根據(jù)所述語音請(qǐng)求樣本、所述文本標(biāo)簽及所述第二相似程度,確定拒識(shí)預(yù)測(cè)結(jié)果;
29、根據(jù)所述拒識(shí)預(yù)測(cè)結(jié)果進(jìn)行模型訓(xùn)練,確定所述自然語言處理模型。
30、如此,在本技術(shù)實(shí)施方式中,可獲取語音請(qǐng)求樣本及語音請(qǐng)求樣本的文本標(biāo)簽,及根據(jù)語音請(qǐng)求樣本與文本標(biāo)簽,確定語音請(qǐng)求樣本與文本標(biāo)簽的第二相似程度,及根據(jù)語音請(qǐng)求樣本、文本標(biāo)簽及第二相似程度,確定拒識(shí)預(yù)測(cè)結(jié)果,及根據(jù)拒識(shí)預(yù)測(cè)結(jié)果進(jìn)行模型訓(xùn)練,從而確定自然語言處理模型,由此實(shí)現(xiàn)自然語言處理模型的訓(xùn)練。
31、在本技術(shù)某些實(shí)施方式中,所述語音請(qǐng)求樣本包括多個(gè),所述根據(jù)所述語音請(qǐng)求樣本、所述文本標(biāo)簽及所述第二相似程度,確定拒識(shí)預(yù)測(cè)結(jié)果,包括:
32、根據(jù)一所述語音請(qǐng)求樣本與每個(gè)所述語音請(qǐng)求樣本的所述文本標(biāo)簽的所述第二相似程度,確定一所述語音請(qǐng)求樣本的多個(gè)所述拒識(shí)預(yù)測(cè)結(jié)果;
33、所述根據(jù)所述拒識(shí)預(yù)測(cè)結(jié)果進(jìn)行模型訓(xùn)練,確定所述自然語言處理模型,包括:
34、根據(jù)每個(gè)所述語音請(qǐng)求樣本的多個(gè)所述拒識(shí)預(yù)測(cè)結(jié)果進(jìn)行模型訓(xùn)練,確定所述自然語言處理模型。
35、如此,在本技術(shù)實(shí)施方式中,可根據(jù)一語音請(qǐng)求樣本與每個(gè)語音請(qǐng)求樣本的文本標(biāo)簽的第二相似程度,確定一語音請(qǐng)求樣本的多個(gè)拒識(shí)預(yù)測(cè)結(jié)果,及根據(jù)每個(gè)語音請(qǐng)求樣本的多個(gè)拒識(shí)預(yù)測(cè)結(jié)果進(jìn)行模型訓(xùn)練,確定自然語言處理模型,使得模型的訓(xùn)練難度上升,進(jìn)而可保障模型的充分訓(xùn)練,模型性能得到保障。
36、本技術(shù)實(shí)施方式提供一種服務(wù)器,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí),實(shí)現(xiàn)上述的語音交互方法。
37、本技術(shù)實(shí)施方式提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序被一個(gè)或多個(gè)處理器執(zhí)行時(shí),實(shí)現(xiàn)上述的語音交互方法。
38、本技術(shù)實(shí)施方式提供的服務(wù)器和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),可使當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果基于當(dāng)前語音請(qǐng)求本身和當(dāng)前語音請(qǐng)求對(duì)應(yīng)的目標(biāo)文本,以及當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本的第一相似程度來確定,從而實(shí)現(xiàn)多維度的拒識(shí)結(jié)果確定,故可在一定程度上保障當(dāng)前語音請(qǐng)求拒識(shí)結(jié)果的準(zhǔn)確與可靠,也因此,可保障基于拒識(shí)結(jié)果進(jìn)行的語音交互的穩(wěn)健與自然,從而可保障用戶與車輛等機(jī)器間的語音交互效果。以及,相比于通過當(dāng)前語音請(qǐng)求本身或當(dāng)前語音請(qǐng)求對(duì)應(yīng)的文本,確定當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果的方式而言,本技術(shù)實(shí)施方式基于當(dāng)前語音請(qǐng)求與當(dāng)前語音請(qǐng)求對(duì)應(yīng)的目標(biāo)文本間的第一相似程度,使得在確定當(dāng)前語音請(qǐng)求的拒識(shí)結(jié)果的過程中,能夠考慮到當(dāng)前語音請(qǐng)求與對(duì)應(yīng)的目標(biāo)文本之間的映射關(guān)系,故可進(jìn)一步保障拒識(shí)結(jié)果的有效與可靠。
39、本技術(shù)的實(shí)施方式的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本技術(shù)的實(shí)施方式的實(shí)踐了解到。