本發(fā)明屬于機(jī)器人控制,尤其涉及一種機(jī)器人導(dǎo)航路徑的生成方法及系統(tǒng)。
背景技術(shù):
1、隨著機(jī)器人技術(shù)的快速發(fā)展,自主導(dǎo)航成為機(jī)器人領(lǐng)域的重要研究方向。在動態(tài)環(huán)境中,機(jī)器人需要實時感知周圍環(huán)境并做出合理的導(dǎo)航?jīng)Q策,尤其是在人機(jī)共存的環(huán)境中(如商場、醫(yī)院、機(jī)場等),機(jī)器人與行人之間的交互增加了導(dǎo)航的復(fù)雜性。傳統(tǒng)的導(dǎo)航方法通常依賴于靜態(tài)地圖和預(yù)設(shè)規(guī)則,難以應(yīng)對動態(tài)環(huán)境中的不確定性。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種機(jī)器人導(dǎo)航路徑的生成方法及系統(tǒng),用于解決通常依賴于靜態(tài)地圖和預(yù)設(shè)規(guī)則,難以應(yīng)對動態(tài)環(huán)境中的不確定性的技術(shù)問題。
2、第一方面,本發(fā)明提供一種機(jī)器人導(dǎo)航路徑的生成方法,包括:
3、根據(jù)機(jī)器人的潛在狀態(tài)和行人的潛在狀態(tài)構(gòu)建動態(tài)關(guān)系圖;
4、根據(jù)預(yù)設(shè)的側(cè)信道狀態(tài)序列匹配策略對所述動態(tài)關(guān)系圖中的特征矩陣進(jìn)行優(yōu)化,得到鄰接矩陣,并將所述鄰接矩陣輸入至圖卷積網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),得到節(jié)點(diǎn)特征矩陣;
5、根據(jù)所述鄰接矩陣和所述節(jié)點(diǎn)特征矩陣進(jìn)行非負(fù)矩陣分解,得到第一潛在因子矩陣和第二潛在因子矩陣;
6、將所述第一潛在因子矩陣、所述第二潛在因子矩陣和所述節(jié)點(diǎn)特征矩陣進(jìn)行融合,得到加權(quán)融合矩陣,并根據(jù)預(yù)設(shè)的自適應(yīng)運(yùn)動結(jié)構(gòu)魯棒篩選策略對所述加權(quán)融合矩陣進(jìn)行篩選,得到關(guān)鍵狀態(tài)矩陣;
7、將所述關(guān)鍵狀態(tài)矩陣線性轉(zhuǎn)換為查詢矩陣、鍵矩陣以及值矩陣,并輸入至預(yù)設(shè)的transformer模型中,所述transformer模型輸出得到增強(qiáng)特征矩陣;
8、根據(jù)所述增強(qiáng)特征矩陣動態(tài)更新所述鄰接矩陣,得到目標(biāo)鄰接矩陣,將所述目標(biāo)鄰接矩陣輸入至過程獎勵模型,并根據(jù)改進(jìn)的蒙特卡洛樹搜索算法進(jìn)行搜索,所述過程獎勵模型輸出得到最優(yōu)導(dǎo)航路徑。
9、第二方面,本發(fā)明提供一種機(jī)器人導(dǎo)航路徑的生成系統(tǒng),包括:
10、構(gòu)建模塊,配置為根據(jù)機(jī)器人的潛在狀態(tài)和行人的潛在狀態(tài)構(gòu)建動態(tài)關(guān)系圖;
11、優(yōu)化模塊,配置為根據(jù)預(yù)設(shè)的側(cè)信道狀態(tài)序列匹配策略對所述動態(tài)關(guān)系圖中的特征矩陣進(jìn)行優(yōu)化,得到鄰接矩陣,并將所述鄰接矩陣輸入至圖卷積網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),得到節(jié)點(diǎn)特征矩陣;
12、分解模塊,配置為根據(jù)所述鄰接矩陣和所述節(jié)點(diǎn)特征矩陣進(jìn)行非負(fù)矩陣分解,得到第一潛在因子矩陣和第二潛在因子矩陣;
13、篩選模塊,配置為將所述第一潛在因子矩陣、所述第二潛在因子矩陣和所述節(jié)點(diǎn)特征矩陣進(jìn)行融合,得到加權(quán)融合矩陣,并根據(jù)預(yù)設(shè)的自適應(yīng)運(yùn)動結(jié)構(gòu)魯棒篩選策略對所述加權(quán)融合矩陣進(jìn)行篩選,得到關(guān)鍵狀態(tài)矩陣;
14、第一輸出模塊,配置為將所述關(guān)鍵狀態(tài)矩陣線性轉(zhuǎn)換為查詢矩陣、鍵矩陣以及值矩陣,并輸入至預(yù)設(shè)的transformer模型中,所述transformer模型輸出得到增強(qiáng)特征矩陣;
15、第二輸出模塊,配置為根據(jù)所述增強(qiáng)特征矩陣動態(tài)更新所述鄰接矩陣,得到目標(biāo)鄰接矩陣,將所述目標(biāo)鄰接矩陣輸入至過程獎勵模型,并根據(jù)改進(jìn)的蒙特卡洛樹搜索算法進(jìn)行搜索,所述過程獎勵模型輸出得到最優(yōu)導(dǎo)航路徑。
16、第三方面,提供一種電子設(shè)備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本發(fā)明任一實施例的機(jī)器人導(dǎo)航路徑的生成方法的步驟。
17、第四方面,本發(fā)明還提供一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,所述程序指令被處理器執(zhí)行時,使所述處理器執(zhí)行本發(fā)明任一實施例的機(jī)器人導(dǎo)航路徑的生成方法的步驟。
18、本申請的機(jī)器人導(dǎo)航路徑的生成方法及系統(tǒng),根據(jù)預(yù)設(shè)的側(cè)信道狀態(tài)序列匹配策略對動態(tài)關(guān)系圖中的特征矩陣進(jìn)行優(yōu)化,得到鄰接矩陣,并將鄰接矩陣輸入至圖卷積網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),得到節(jié)點(diǎn)特征矩陣,根據(jù)鄰接矩陣和節(jié)點(diǎn)特征矩陣進(jìn)行非負(fù)矩陣分解,得到第一潛在因子矩陣和第二潛在因子矩陣,將第一潛在因子矩陣、第二潛在因子矩陣和節(jié)點(diǎn)特征矩陣進(jìn)行融合,得到加權(quán)融合矩陣,并根據(jù)預(yù)設(shè)的自適應(yīng)運(yùn)動結(jié)構(gòu)魯棒篩選策略對加權(quán)融合矩陣進(jìn)行篩選,得到關(guān)鍵狀態(tài)矩陣,將關(guān)鍵狀態(tài)矩陣線性轉(zhuǎn)換為查詢矩陣、鍵矩陣以及值矩陣,并輸入至預(yù)設(shè)的transformer模型中,transformer模型輸出得到增強(qiáng)特征矩陣,根據(jù)增強(qiáng)特征矩陣動態(tài)更新鄰接矩陣,得到目標(biāo)鄰接矩陣,將目標(biāo)鄰接矩陣輸入至過程獎勵模型,并根據(jù)改進(jìn)的蒙特卡洛樹搜索算法進(jìn)行搜索,過程獎勵模型輸出得到最優(yōu)導(dǎo)航路徑,實現(xiàn)了對動態(tài)環(huán)境中機(jī)器人與行人交互的深度建模和高效規(guī)劃,提高了機(jī)器人自主導(dǎo)航的準(zhǔn)確度,有利于機(jī)器人在動態(tài)環(huán)境中的高效導(dǎo)航與決策。
1.一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,所述根據(jù)機(jī)器人的潛在狀態(tài)和行人的潛在狀態(tài)構(gòu)建動態(tài)關(guān)系圖包括:
3.根據(jù)權(quán)利要求1所述的一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,所述根據(jù)預(yù)設(shè)的側(cè)信道狀態(tài)序列匹配策略對所述動態(tài)關(guān)系圖中的特征矩陣進(jìn)行優(yōu)化,得到鄰接矩陣包括:
4.根據(jù)權(quán)利要求1所述的一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,其中,將所述鄰接矩陣輸入至圖卷積網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),得到節(jié)點(diǎn)特征矩陣的表達(dá)式為:
5.根據(jù)權(quán)利要求1所述的一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,其中,根據(jù)所述鄰接矩陣和所述節(jié)點(diǎn)特征矩陣進(jìn)行非負(fù)矩陣分解,得到第一潛在因子矩陣和第二潛在因子矩陣的表達(dá)式為:
6.根據(jù)權(quán)利要求1所述的一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,其中,將所述第一潛在因子矩陣、所述第二潛在因子矩陣和所述節(jié)點(diǎn)特征矩陣進(jìn)行融合,得到加權(quán)融合矩陣的表達(dá)式為:
7.根據(jù)權(quán)利要求1所述的一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,其中,根據(jù)預(yù)設(shè)的自適應(yīng)運(yùn)動結(jié)構(gòu)魯棒篩選策略對所述加權(quán)融合矩陣進(jìn)行篩選,得到關(guān)鍵狀態(tài)矩陣的表達(dá)式為:
8.根據(jù)權(quán)利要求1所述的一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,所述將所述關(guān)鍵狀態(tài)矩陣線性轉(zhuǎn)換為查詢矩陣、鍵矩陣以及值矩陣,并輸入至預(yù)設(shè)的transformer模型中,所述transformer模型輸出得到增強(qiáng)特征矩陣包括:
9.根據(jù)權(quán)利要求1所述的一種機(jī)器人導(dǎo)航路徑的生成方法,其特征在于,所述根據(jù)所述增強(qiáng)特征矩陣動態(tài)更新所述鄰接矩陣,得到目標(biāo)鄰接矩陣,將所述目標(biāo)鄰接矩陣輸入至過程獎勵模型,并根據(jù)改進(jìn)的蒙特卡洛樹搜索算法進(jìn)行搜索,所述過程獎勵模型輸出得到最優(yōu)導(dǎo)航路徑包括:
10.一種機(jī)器人導(dǎo)航路徑的生成系統(tǒng),其特征在于,包括: