1.一種基于深度強(qiáng)化學(xué)習(xí)的執(zhí)行機(jī)構(gòu)容錯(cuò)控制方法,其特征在于包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的執(zhí)行機(jī)構(gòu)容錯(cuò)控制方法,其特征在于所述步驟(2)建立面向發(fā)動(dòng)機(jī)執(zhí)行機(jī)構(gòu)容錯(cuò)控制任務(wù)的深度強(qiáng)化學(xué)習(xí)智能體仿真訓(xùn)練環(huán)境,選取合適變量參數(shù)并設(shè)計(jì)恰當(dāng)?shù)莫?jiǎng)勵(lì)函數(shù),包括:
3.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的執(zhí)行機(jī)構(gòu)容錯(cuò)控制方法,其特征在于所述步驟(4)將訓(xùn)練好的智能體布置在單片機(jī)上對(duì)故障執(zhí)行機(jī)構(gòu)進(jìn)行容錯(cuò)控制,訓(xùn)練完成后,保存智能體動(dòng)作網(wǎng)絡(luò)的權(quán)重參數(shù),并將動(dòng)作網(wǎng)絡(luò)前向通道部署至單片機(jī),單片機(jī)接收從上位機(jī)傳來的發(fā)動(dòng)機(jī)狀態(tài)變量st作為動(dòng)作網(wǎng)絡(luò)的輸入,輸出動(dòng)作變量at發(fā)送至上位機(jī)執(zhí)行機(jī)構(gòu),實(shí)現(xiàn)執(zhí)行機(jī)構(gòu)容錯(cuò)控制。