1.一種在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述獲取專家演示數(shù)據(jù)集,包括以下步驟:
3.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述末端執(zhí)行器上設(shè)有多個(gè)夾指;所述根據(jù)所述關(guān)鍵時(shí)間步對(duì)應(yīng)的所述末端執(zhí)行器位姿進(jìn)行坐標(biāo)映射,得到圖像可供性表示,包括以下步驟:
4.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述末端執(zhí)行器上設(shè)有多個(gè)夾指;所述基于所述關(guān)鍵時(shí)間步劃分得到關(guān)鍵時(shí)間區(qū)間,根據(jù)所述關(guān)鍵時(shí)間區(qū)間每個(gè)時(shí)間點(diǎn)對(duì)應(yīng)的所述末端執(zhí)行器位姿進(jìn)行所述坐標(biāo)映射,得到圖像軌跡表示,包括以下步驟:
5.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述條件變分自編碼器包括編碼器和解碼器;所述將所述初始狀態(tài)的所述圖像觀察和所述語言指令作為圖像和條件輸入映射到隱空間,以所述中間表示圖像作為條件生成目標(biāo),對(duì)條件變分自編碼器進(jìn)行預(yù)訓(xùn)練,得到初始編碼器,包括以下步驟:
6.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述初始編碼器包括編碼器;所述將所述圖像觀察和所述語言指令作為輸入,將所述位姿變化量作為輸出,對(duì)所述初始編碼器進(jìn)行模型學(xué)習(xí)訓(xùn)練,得到目標(biāo)編碼器,包括以下步驟:
7.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述方法還包括以下步驟:
8.一種在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的方法。