本技術(shù)涉及人工智能,特別是涉及一種任務(wù)響應(yīng)策略生成方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、隨著人工智能技術(shù)的發(fā)展,機(jī)器人在不同場(chǎng)景下的應(yīng)用逐漸增多,尤其是在服務(wù)、教育、醫(yī)療等場(chǎng)景。機(jī)器人準(zhǔn)確完成用戶所下達(dá)的指令的前提是,對(duì)于接收到的語(yǔ)音數(shù)據(jù)進(jìn)行準(zhǔn)確識(shí)別,從而基于識(shí)別到的信息理解用戶的意圖,并生成相關(guān)的任務(wù),執(zhí)行任務(wù)所包含的動(dòng)作、對(duì)話等響應(yīng)策略。
2、相關(guān)技術(shù)中,當(dāng)用戶輸入語(yǔ)音數(shù)據(jù)時(shí),機(jī)器人可以將語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù),再?gòu)奈谋緮?shù)據(jù)中確定出關(guān)鍵詞,基于關(guān)鍵詞確定用戶輸入的指令。隨后,再基于預(yù)先設(shè)置的機(jī)器人的響應(yīng)策略和用戶輸入的指令之間的映射關(guān)系,自動(dòng)確定出機(jī)器人待執(zhí)行的響應(yīng)策略。
3、然而,當(dāng)用戶輸出的語(yǔ)音數(shù)據(jù)中包含的指令較復(fù)雜時(shí),機(jī)器人往往無(wú)法準(zhǔn)確識(shí)別,從而導(dǎo)致生成的機(jī)器人的響應(yīng)策略的準(zhǔn)確性不高。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述技術(shù)問題,提供一種能夠提高機(jī)器人生成的任務(wù)響應(yīng)策略的準(zhǔn)確性的任務(wù)響應(yīng)策略生成方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。
2、第一方面,本技術(shù)提供了一種任務(wù)響應(yīng)策略生成方法,包括:
3、獲取用戶輸入的語(yǔ)音指令數(shù)據(jù),所述語(yǔ)音指令數(shù)據(jù)用于指示機(jī)器人執(zhí)行所述用戶指示的目標(biāo)任務(wù);
4、將所述語(yǔ)音指令數(shù)據(jù)轉(zhuǎn)換為文本指令數(shù)據(jù);
5、根據(jù)所述用戶對(duì)應(yīng)的上下文信息,識(shí)別所述文本指令數(shù)據(jù),確定出所述目標(biāo)任務(wù)中所包含的任務(wù)指令,所述上下文信息包括滿足所述目標(biāo)任務(wù)的關(guān)聯(lián)條件的歷史任務(wù)數(shù)據(jù);
6、根據(jù)所述任務(wù)指令,確定所述機(jī)器人執(zhí)行所述目標(biāo)任務(wù)的響應(yīng)策略數(shù)據(jù)。
7、在一些實(shí)施例中,所述將所述語(yǔ)音指令數(shù)據(jù)轉(zhuǎn)換為文本指令數(shù)據(jù),包括:
8、對(duì)所述語(yǔ)音指令數(shù)據(jù)進(jìn)行過濾,去除所述語(yǔ)音指令數(shù)據(jù)中的環(huán)境音;
9、將過濾后的語(yǔ)音指令數(shù)據(jù)輸入自動(dòng)語(yǔ)音識(shí)別asr模型,并獲取所述asr模型輸出的所述語(yǔ)音指令數(shù)據(jù)中所包含的音素或單詞,所述asr模型用于識(shí)別所述語(yǔ)音指令數(shù)據(jù)中的聲學(xué)特征并根據(jù)所述聲學(xué)特征匹配得到所述語(yǔ)音指令數(shù)據(jù)中所包含的音素或單詞;
10、對(duì)所述語(yǔ)音指令數(shù)據(jù)中所包含的音素或單詞進(jìn)行解碼,并根據(jù)解碼結(jié)果形成所述文本指令數(shù)據(jù)。
11、在一些實(shí)施例中,在所述根據(jù)所述用戶對(duì)應(yīng)的上下文信息,識(shí)別所述文本指令數(shù)據(jù),確定出所述目標(biāo)任務(wù)中所包含的任務(wù)指令之前,所述方法包括:
12、采集所述用戶的生物識(shí)別信息;
13、根據(jù)所述用戶的生物識(shí)別信息,獲取所述用戶對(duì)應(yīng)的歷史任務(wù)數(shù)據(jù),所述歷史任務(wù)數(shù)據(jù)中包括有任務(wù)時(shí)間標(biāo)簽;
14、根據(jù)所述任務(wù)時(shí)間標(biāo)簽,確定出所述用戶對(duì)應(yīng)的歷史任務(wù)數(shù)據(jù)的置信度;
15、將置信度大于置信度閾值的歷史任務(wù)數(shù)據(jù),確定為所述用戶對(duì)應(yīng)的滿足所述目標(biāo)任務(wù)的關(guān)聯(lián)條件的上下文信息。
16、在一些實(shí)施例中,所述根據(jù)所述用戶對(duì)應(yīng)的上下文信息,識(shí)別所述文本指令數(shù)據(jù),確定出所述目標(biāo)任務(wù)中所包含的任務(wù)指令,包括:
17、從所述用戶對(duì)應(yīng)的上下文信息中提取所述用戶的興趣點(diǎn);
18、根據(jù)所述用戶的興趣點(diǎn),對(duì)所述文本指令數(shù)據(jù)進(jìn)行識(shí)別,確定出所述用戶的任務(wù)意圖信息;
19、根據(jù)所述用戶的任務(wù)意圖信息,確定出所述目標(biāo)任務(wù)中所包含的任務(wù)指令。
20、在一些實(shí)施例中,若所述任務(wù)指令為模糊指令,則所述方法還包括:
21、識(shí)別所述模糊指令中的至少一項(xiàng)待填充的元素填充槽位;
22、根據(jù)所述用戶的任務(wù)意圖信息和所述元素填充槽位的屬性信息,為每個(gè)元素填充槽位生成至少一個(gè)指令元素;
23、根據(jù)每個(gè)元素填充槽位對(duì)應(yīng)的至少一個(gè)指令元素,補(bǔ)全所述模糊指令,生成所述模糊指令對(duì)應(yīng)的至少一個(gè)候選指令;
24、從所述模糊指令對(duì)應(yīng)的至少一個(gè)候選指令中確定出所述模糊指令對(duì)應(yīng)的補(bǔ)全指令。
25、在一些實(shí)施例中,所述從所述模糊指令對(duì)應(yīng)的至少一個(gè)候選指令中確定出所述模糊指令對(duì)應(yīng)的補(bǔ)全指令,包括:
26、執(zhí)行所述至少一個(gè)候選指令對(duì)應(yīng)的多輪交互對(duì)話;
27、根據(jù)所述多輪交互對(duì)話中所述用戶針對(duì)所述至少一個(gè)候選指令的反饋信息,從所述至少一個(gè)候選指令中確定出所述模糊指令對(duì)應(yīng)的補(bǔ)全指令。
28、第二方面,本技術(shù)還提供了一種任務(wù)響應(yīng)策略生成裝置,包括:
29、獲取模塊,用于獲取用戶輸入的語(yǔ)音指令數(shù)據(jù),所述語(yǔ)音指令數(shù)據(jù)用于指示機(jī)器人執(zhí)行所述用戶指示的目標(biāo)任務(wù);
30、轉(zhuǎn)換模塊,用于將所述語(yǔ)音指令數(shù)據(jù)轉(zhuǎn)換為文本指令數(shù)據(jù);
31、識(shí)別模塊,用于根據(jù)所述用戶對(duì)應(yīng)的上下文信息,識(shí)別所述文本指令數(shù)據(jù),確定出所述目標(biāo)任務(wù)中所包含的任務(wù)指令,所述上下文信息中包括滿足所述目標(biāo)任務(wù)的關(guān)聯(lián)條件的歷史任務(wù)數(shù)據(jù);
32、響應(yīng)模塊,用于根據(jù)所述任務(wù)指令,確定所述機(jī)器人執(zhí)行所述目標(biāo)任務(wù)的響應(yīng)策略數(shù)據(jù)。
33、在一些實(shí)施例中,所述轉(zhuǎn)換模塊,還用于對(duì)所述語(yǔ)音指令數(shù)據(jù)進(jìn)行過濾,去除所述語(yǔ)音指令數(shù)據(jù)中的環(huán)境音;將過濾后的語(yǔ)音指令數(shù)據(jù)輸入自動(dòng)語(yǔ)音識(shí)別asr模型,并獲取所述asr模型輸出的所述語(yǔ)音指令數(shù)據(jù)中所包含的音素或單詞,所述asr模型用于識(shí)別所述語(yǔ)音指令數(shù)據(jù)中的聲學(xué)特征并根據(jù)所述聲學(xué)特征匹配得到所述語(yǔ)音指令數(shù)據(jù)中所包含的音素或單詞;對(duì)所述語(yǔ)音指令數(shù)據(jù)中所包含的音素或單詞進(jìn)行解碼,并根據(jù)解碼結(jié)果形成所述文本指令數(shù)據(jù)。
34、在一些實(shí)施例中,所述識(shí)別模塊,還用于采集所述用戶的生物識(shí)別信息;根據(jù)所述用戶的生物識(shí)別信息,獲取所述用戶對(duì)應(yīng)的歷史任務(wù)數(shù)據(jù),所述歷史任務(wù)數(shù)據(jù)中包括有任務(wù)時(shí)間標(biāo)簽;根據(jù)所述任務(wù)時(shí)間標(biāo)簽,確定出所述用戶對(duì)應(yīng)的歷史任務(wù)數(shù)據(jù)的置信度;將置信度大于置信度閾值的歷史任務(wù)數(shù)據(jù),確定為所述用戶對(duì)應(yīng)的滿足所述目標(biāo)任務(wù)的關(guān)聯(lián)條件的上下文信息。
35、在一些實(shí)施例中,所述識(shí)別模塊,還用于從所述用戶對(duì)應(yīng)的上下文信息中提取所述用戶的興趣點(diǎn);根據(jù)所述用戶的興趣點(diǎn),對(duì)所述文本指令數(shù)據(jù)進(jìn)行識(shí)別,確定出所述用戶的任務(wù)意圖信息;根據(jù)所述用戶的任務(wù)意圖信息,確定出所述目標(biāo)任務(wù)中所包含的任務(wù)指令。
36、在一些實(shí)施例中,若所述任務(wù)指令為模糊指令,則所述識(shí)別模塊,還用于識(shí)別所述模糊指令中的至少一項(xiàng)待填充的元素填充槽位;根據(jù)所述用戶的任務(wù)意圖信息和所述元素填充槽位的屬性信息,為每個(gè)元素填充槽位生成至少一個(gè)指令元素;根據(jù)每個(gè)元素填充槽位對(duì)應(yīng)的至少一個(gè)指令元素,補(bǔ)全所述模糊指令,生成所述模糊指令對(duì)應(yīng)的至少一個(gè)候選指令;從所述模糊指令對(duì)應(yīng)的至少一個(gè)候選指令中確定出所述模糊指令對(duì)應(yīng)的補(bǔ)全指令。
37、在一些實(shí)施例中,所述識(shí)別模塊,還用于執(zhí)行所述至少一個(gè)候選指令對(duì)應(yīng)的多輪交互對(duì)話;根據(jù)所述多輪交互對(duì)話中所述用戶針對(duì)所述至少一個(gè)候選指令的反饋信息,從所述至少一個(gè)候選指令中確定出所述模糊指令對(duì)應(yīng)的補(bǔ)全指令。
38、第三方面,本技術(shù)還提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述第一方面所述的任務(wù)響應(yīng)策略生成方法。
39、第四方面,本技術(shù)還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述的任務(wù)響應(yīng)策略生成方法。
40、第五方面,本技術(shù)還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述的任務(wù)響應(yīng)策略生成方法。
41、上述任務(wù)響應(yīng)策略生成方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品,首先獲取用戶輸入的語(yǔ)音指令數(shù)據(jù),語(yǔ)音指令數(shù)據(jù)用于指示機(jī)器人執(zhí)行用戶指示的目標(biāo)任務(wù)。隨后,將語(yǔ)音指令數(shù)據(jù)轉(zhuǎn)換為文本指令數(shù)據(jù),并根據(jù)用戶對(duì)應(yīng)的上下文信息,識(shí)別文本指令數(shù)據(jù),確定出目標(biāo)任務(wù)中所包含的任務(wù)指令,上下文信息包括滿足目標(biāo)任務(wù)的關(guān)聯(lián)條件的歷史任務(wù)數(shù)據(jù)。最后,根據(jù)任務(wù)指令,確定機(jī)器人執(zhí)行目標(biāo)任務(wù)的響應(yīng)策略數(shù)據(jù)。由于結(jié)合目標(biāo)任務(wù)關(guān)聯(lián)的上下文信息,來(lái)輔助對(duì)文本指令數(shù)據(jù)進(jìn)行任務(wù)指令的識(shí)別,從而可以減小指令過于復(fù)雜時(shí)單純依靠關(guān)鍵詞識(shí)別而造成的識(shí)別錯(cuò)誤,提高了機(jī)器人生成的任務(wù)響應(yīng)策略的準(zhǔn)確性。