最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法及裝置

文檔序號(hào):41955279發(fā)布日期:2025-05-16 14:21閱讀:來源:國(guó)知局

技術(shù)特征:

1.一種在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述方法包括以下步驟:

2.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述獲取專家演示數(shù)據(jù)集,包括以下步驟:

3.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述末端執(zhí)行器上設(shè)有多個(gè)夾指;所述根據(jù)所述關(guān)鍵時(shí)間步對(duì)應(yīng)的所述末端執(zhí)行器位姿進(jìn)行坐標(biāo)映射,得到圖像可供性表示,包括以下步驟:

4.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述末端執(zhí)行器上設(shè)有多個(gè)夾指;所述基于所述關(guān)鍵時(shí)間步劃分得到關(guān)鍵時(shí)間區(qū)間,根據(jù)所述關(guān)鍵時(shí)間區(qū)間每個(gè)時(shí)間點(diǎn)對(duì)應(yīng)的所述末端執(zhí)行器位姿進(jìn)行所述坐標(biāo)映射,得到圖像軌跡表示,包括以下步驟:

5.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述條件變分自編碼器包括編碼器和解碼器;所述將所述初始狀態(tài)的所述圖像觀察和所述語言指令作為圖像和條件輸入映射到隱空間,以所述中間表示圖像作為條件生成目標(biāo),對(duì)條件變分自編碼器進(jìn)行預(yù)訓(xùn)練,得到初始編碼器,包括以下步驟:

6.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述初始編碼器包括編碼器;所述將所述圖像觀察和所述語言指令作為輸入,將所述位姿變化量作為輸出,對(duì)所述初始編碼器進(jìn)行模型學(xué)習(xí)訓(xùn)練,得到目標(biāo)編碼器,包括以下步驟:

7.根據(jù)權(quán)利要求1所述的在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法,其特征在于,所述方法還包括以下步驟:

8.一種在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練裝置,其特征在于,所述裝置包括:

9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的方法。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的方法。


技術(shù)總結(jié)
本發(fā)明公開了一種在隱空間中學(xué)習(xí)中間表示的模仿學(xué)習(xí)訓(xùn)練方法及裝置,本發(fā)明應(yīng)用于機(jī)器人語言條件模仿學(xué)習(xí)的端到端訓(xùn)練,通過將軌跡指導(dǎo)與可供性指導(dǎo)相結(jié)合,提出了一種新的中間表示形式,同時(shí),本發(fā)明將訓(xùn)練過程劃分為兩個(gè)階段:第一階段,使用原始圖像與中間表示進(jìn)行CVAE生成式預(yù)訓(xùn)練,將中間表示帶來的額外先驗(yàn)信息提取到隱空間中,第二階段,凍結(jié)編碼器參數(shù),使用擴(kuò)散策略結(jié)合隱向量進(jìn)行交叉注意力以生成動(dòng)作,進(jìn)行端到端模仿學(xué)習(xí)的訓(xùn)練。這樣的做法能夠在隱空間上對(duì)中間表示的指導(dǎo)信息進(jìn)行學(xué)習(xí),同時(shí)在推理時(shí)無需顯示地生成中間表示,減少了復(fù)合誤差對(duì)模型推理的影響,可廣泛應(yīng)用于數(shù)據(jù)處理技術(shù)領(lǐng)域。

技術(shù)研發(fā)人員:劉萬泉,張嘉晟
受保護(hù)的技術(shù)使用者:中山大學(xué)·深圳
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/15
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1