1.一種剩余壽命不確定下的飛機(jī)強(qiáng)化學(xué)習(xí)預(yù)測(cè)性維修決策方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,依據(jù)所述長(zhǎng)期收益和所述第二值分布強(qiáng)化學(xué)習(xí)模型,更新所述第一值分布強(qiáng)化學(xué)習(xí)模型的網(wǎng)絡(luò)參數(shù)的步驟,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述第二值分布強(qiáng)化學(xué)習(xí)模型,計(jì)算所述飛機(jī)維修決策對(duì)應(yīng)的長(zhǎng)期收益的步驟,包括:
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,依據(jù)所述長(zhǎng)期收益計(jì)算所述第二值分布強(qiáng)化學(xué)習(xí)模型的損失函數(shù),并基于所述損失函數(shù)計(jì)算自適應(yīng)更新間隔的步驟,包括:
6.一種剩余壽命不確定下的飛機(jī)強(qiáng)化學(xué)習(xí)預(yù)測(cè)性維修決策裝置,其特征在于,所述裝置包括:
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述更新模塊包括:
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于:
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述計(jì)算模塊包括:
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第一子模塊具體用于:
11.一種電子設(shè)備,其特征在于,包括處理器、通信接口、存儲(chǔ)器和通信總線,其中,處理器,通信接口,存儲(chǔ)器通過(guò)通信總線完成相互間的通信;