1.一種基于多無人機的協(xié)同偵察及電子對抗控制系統(tǒng),其特征在于,所述系統(tǒng)包括通信模塊、任務(wù)分解模塊、強化學習決策模塊、協(xié)作優(yōu)化模塊和任務(wù)評估模塊;
2.一種基于多無人機的協(xié)同偵察及電子對抗控制系統(tǒng),其特征在于,所述任務(wù)分解模塊通過通信模塊傳遞任務(wù)指令并與強化學習決策模塊合作,獲取任務(wù)決策結(jié)果;
3.使用權(quán)利要求1-2所述的系統(tǒng)進行一種基于多無人機協(xié)同偵察及電子對抗的控制方法,其特征在于,所述方法包括如下步驟:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于:所述偵察子任務(wù)的偵察策略訓練時,輸入狀態(tài)空間包括敵方信號的位置和無人機的當前位置信息,輸出動作空間包括飛行路徑調(diào)整和偵察信號頻率分配。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于:所述干擾子任務(wù)中的決策策略中,輸入狀態(tài)包括敵方雷達的信號頻段和強度,輸出動作空間包括干擾頻率、功率選擇以及目標干擾強度的選擇。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于:所述通信模塊在每架無人機啟動時,進行通信初始化,通過廣播發(fā)現(xiàn)其周圍的其他無人機節(jié)點,并建立鄰居節(jié)點列表;
7.根據(jù)權(quán)利要求3所述的方法,其特征在于:所述偵察子任務(wù)決策過程由無人機的狀態(tài)空間、動作空間數(shù)據(jù)和設(shè)定的獎勵函數(shù)控制。
8.根據(jù)權(quán)利要求3所述的方法,其特征在于:所述狀態(tài)空間中無人機的位置使用相對坐標表示,其中原點定義為無人機首次偵察到雷達信息的位置,偵察的方向以絕對角度表示,起點為正北方向的0°,并順時針計算;
9.根據(jù)權(quán)利要求3所述的方法,其特征在于:所述偵察子任務(wù)和所述干擾子任務(wù)分別決策出飛行動作與偵察動作組合、飛行動作與干擾動作組合,根據(jù)任務(wù)進展情況決策出重復飛行動作的權(quán)重,并與獨立的偵察動作和干擾動作得出完整的綜合決策。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于:所述偵察策略單元深度學習訓練中每個事件的樣本數(shù)據(jù)被存儲于經(jīng)驗池中,在事件結(jié)束后,通過蒙特卡洛方法對樣本進行處理,并基于critic網(wǎng)絡(luò)對全局狀態(tài)信息處理,捕捉無人機之間的協(xié)作關(guān)系: