1.基于光慣融合全身動作捕捉的機(jī)器人強(qiáng)化學(xué)習(xí)模型構(gòu)建方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于光慣融合全身動作捕捉的機(jī)器人強(qiáng)化學(xué)習(xí)模型構(gòu)建方法,其特征在于,所述對所述運(yùn)動數(shù)據(jù)和所述相機(jī)圖像數(shù)據(jù)進(jìn)行處理的過程包括:
3.根據(jù)權(quán)利要求2所述的基于光慣融合全身動作捕捉的機(jī)器人強(qiáng)化學(xué)習(xí)模型構(gòu)建方法,其特征在于,所述融合與優(yōu)化的過程包括:
4.根據(jù)權(quán)利要求2所述的基于光慣融合全身動作捕捉的機(jī)器人強(qiáng)化學(xué)習(xí)模型構(gòu)建方法,其特征在于,所述對所述相機(jī)圖像數(shù)據(jù)進(jìn)行預(yù)處理,然后輸入預(yù)先訓(xùn)練的深度學(xué)習(xí)姿態(tài)估計模型中的過程包括:
5.根據(jù)權(quán)利要求4所述的基于光慣融合全身動作捕捉的機(jī)器人強(qiáng)化學(xué)習(xí)模型構(gòu)建方法,其特征在于,所述深度學(xué)習(xí)姿態(tài)估計模型的訓(xùn)練方法包括:
6.根據(jù)權(quán)利要求5所述的基于光慣融合全身動作捕捉的機(jī)器人強(qiáng)化學(xué)習(xí)模型構(gòu)建方法,其特征在于,所述指定損失函數(shù)為:
7.根據(jù)權(quán)利要求6所述的基于光慣融合全身動作捕捉的機(jī)器人強(qiáng)化學(xué)習(xí)模型構(gòu)建方法,其特征在于,所述權(quán)重調(diào)節(jié)系數(shù)的配置方法包括:
8.根據(jù)權(quán)利要求1所述的基于光慣融合全身動作捕捉的機(jī)器人強(qiáng)化學(xué)習(xí)模型構(gòu)建方法,其特征在于,所述預(yù)設(shè)獎勵函數(shù)包括: