本發(fā)明屬于通信,更具體地說,是涉及一種自組網(wǎng)場景下的通信抗干擾方法及系統(tǒng)。
背景技術(shù):
1、傳統(tǒng)抗干擾方法的發(fā)射機邏輯為:發(fā)射機根據(jù)前一時刻的誤碼率改變發(fā)射方案:如果前一時刻的誤碼率符合通信標準,發(fā)射機保持發(fā)射方案不變;如果前一時刻誤碼率不符合通信標準,80%的可能性改變通信信道,10%的可能性增大一級發(fā)射功率,10%的可能性隨機移動。傳統(tǒng)抗干擾方法具有以下缺點:
2、1、缺乏實時感知能力:傳統(tǒng)技術(shù)大多是基于固定模式工作的。比如,跳頻技術(shù)會在多個頻段間跳躍,擴頻技術(shù)會將信號分散在較寬的頻帶上。這些方法依賴的是預定的參數(shù)和模式,而不是實時環(huán)境的變化。系統(tǒng)通常不能根據(jù)實時的電磁環(huán)境和干擾源的變化進行動態(tài)的偵測和調(diào)整。
3、2、容易造成資源浪費:傳統(tǒng)的抗干擾技術(shù)通常依賴于一種或幾種固定的抗干擾措施,如跳頻、擴頻或信號加密等。使用抗干擾方法時,系統(tǒng)在處理干擾時沒有做到最優(yōu)化,導致不必要的資源消耗,進而影響整體效率。例如,頻率跳變需要頻繁切換頻率,而如果干擾并不集中在某個頻段,頻率跳變就成了資源的浪費;
4、3、缺乏智能化適應(yīng)能力:傳統(tǒng)的抗干擾技術(shù)多依賴于預設(shè)的算法和固定模式,這意味著它們?nèi)狈Ω蓴_環(huán)境的智能感知和實時適應(yīng)能力。尤其是在復雜的電磁環(huán)境中,固定的抗干擾手段可能無法實時調(diào)整其策略,應(yīng)對有新干擾措施的干擾源,導致通信中斷或性能下降。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例的目的在于提供一種自組網(wǎng)場景下的通信抗干擾方法,以解決現(xiàn)有技術(shù)中存在的缺乏實時感知能力、容易造成資源浪費、缺乏智能化適應(yīng)能力的技術(shù)問題。
2、為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:提供一種自組網(wǎng)場景下的通信抗干擾方法,包括以下步驟:
3、發(fā)射機偵測信道獲取信道信息;
4、根據(jù)當前信道信息選擇通信方案,所述通信方案包括發(fā)射功率、發(fā)射信道和空間位置;
5、接收機計算誤碼率;
6、干擾機根據(jù)誤碼率結(jié)合強化學習改變干擾方案,所述干擾方案包括干擾功率、干擾信道和空間位置;
7、重復上述步驟,直至誤碼率大于預定閾值。
8、可選地,所述發(fā)射機偵測信道獲取信道信息的步驟中,所述信道信息包括上一次通信時所述發(fā)射機的發(fā)射功率,上一次通信時所述發(fā)射機所選擇的信道,上一次所述發(fā)射機所處的位置和這一次通信時所述干擾機所選擇的信道,所述發(fā)射機的發(fā)射功率、所述發(fā)射機的信道、所述發(fā)射機的位置和所述干擾機的信道組成所述強化學習中智能體在環(huán)境中的狀態(tài)。
9、可選地,所述干擾機根據(jù)誤碼率結(jié)合強化學習改變干擾方案的步驟包括:
10、對所述智能體在環(huán)境中的狀態(tài)采用獨熱編碼進行預處理;
11、根據(jù)預處理的信息使用強化學習算法形成抗干擾模型;
12、根據(jù)所述抗干擾模型改變干擾方案。
13、可選地,所述強化學習算法包括優(yōu)先經(jīng)驗回放算法、ddqn算法和dueling?dqn算法。
14、可選地,獎懲算法設(shè)置為:
15、若當前誤碼率比前一個時刻誤碼率大,則獎勵值為-8;
16、若當前誤碼率大于10-5時,超過平均誤碼率閾值,則獎勵值為-10,并結(jié)束此輪學習,開始下一輪學習。
17、可選地,訓練過程包括:
18、初始化環(huán)境形成初始化狀態(tài);
19、將初始化狀態(tài)作為這一時刻的狀態(tài)送入神經(jīng)網(wǎng)絡(luò)中,得到所述發(fā)射機要選擇的動作;
20、所述接收機計算誤碼率,根據(jù)誤碼率得到獎懲算法,并根據(jù)誤碼率決定所述干擾機下一時刻的行為,這一時刻狀態(tài)、發(fā)射機要選擇的動作、獎懲值和下一時刻的狀態(tài)組成一個四元組;
21、重復上述步驟,直到誤碼率超過所述預定閾值或通信時長超過所述預定閾值。
22、可選地,在訓練過程之后,測試過程包括:
23、載入已經(jīng)訓練好的神經(jīng)網(wǎng)絡(luò)參數(shù)到所述發(fā)射機,再初始化環(huán)境,初始化發(fā)射機的發(fā)射功率、發(fā)射信道,發(fā)射機的位置組成了初始化狀態(tài);
24、將初始化狀態(tài)作為這一時刻的狀態(tài)送入神經(jīng)網(wǎng)絡(luò),得到所述要選擇的動作;
25、所述接收機計算誤碼率,根據(jù)誤碼率得到獎懲算法,并根據(jù)誤碼率決定所述干擾機下一時刻的行為;
26、重復上述步驟,直到達到通信時長最大值。
27、可選地,所述干擾機的干擾方案建模為馬爾可夫模型。
28、本發(fā)明還提供一種自組網(wǎng)場景下的通信抗干擾系統(tǒng),使用上述的自組網(wǎng)場景下的通信抗干擾方法,系統(tǒng)包括具有預定面積的通信場景、在預定范圍內(nèi)可移動的發(fā)射機、固定設(shè)置的接收機以及干擾機,所述預定范圍位于所述通信場景內(nèi),所述接收機位于所述預定范圍內(nèi),所述干擾機在所述預定范圍外及所述通信場景內(nèi)可移動。
29、本發(fā)明提供的自組網(wǎng)場景下的通信抗干擾方法及系統(tǒng)的有益效果在于:與現(xiàn)有技術(shù)相比,本發(fā)明自組網(wǎng)場景下的通信抗干擾方法,可以實施感知電磁環(huán)境,根據(jù)干擾源的變化對發(fā)射方案進行動態(tài)調(diào)整,其次在保證通信質(zhì)量的前提下,盡量減少資源浪費,最后對新增干擾措施的干擾源,也能迅速適應(yīng),保證通信質(zhì)量。
1.一種自組網(wǎng)場景下的通信抗干擾方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的自組網(wǎng)場景下的通信抗干擾方法,其特征在于,所述發(fā)射機偵測信道獲取信道信息的步驟中,所述信道信息包括上一次通信時所述發(fā)射機的發(fā)射功率,上一次通信時所述發(fā)射機所選擇的信道,上一次所述發(fā)射機所處的位置和這一次通信時所述干擾機所選擇的信道,所述發(fā)射機的發(fā)射功率、所述發(fā)射機的信道、所述發(fā)射機的位置和所述干擾機的信道組成所述強化學習中智能體在環(huán)境中的狀態(tài)。
3.如權(quán)利要求2所述的自組網(wǎng)場景下的通信抗干擾方法,其特征在于,所述干擾機根據(jù)誤碼率結(jié)合強化學習改變干擾方案的步驟包括:
4.如權(quán)利要求1所述的自組網(wǎng)場景下的通信抗干擾方法,其特征在于,所述強化學習算法包括優(yōu)先經(jīng)驗回放算法、ddqn算法和dueling?dqn算法。
5.如權(quán)利要求1所述的自組網(wǎng)場景下的通信抗干擾方法,其特征在于,獎懲算法設(shè)置為:
6.如權(quán)利要求1所述的自組網(wǎng)場景下的通信抗干擾方法,其特征在于,訓練過程包括:
7.如權(quán)利要求6所述的自組網(wǎng)場景下的通信抗干擾方法,其特征在于,在訓練過程之后,測試過程包括:
8.如權(quán)利要求1所述的自組網(wǎng)場景下的通信抗干擾方法,其特征在于,所述干擾機的干擾方案建模為馬爾可夫模型。
9.一種自組網(wǎng)場景下的通信抗干擾系統(tǒng),使用權(quán)利要求1-8任一項所述的自組網(wǎng)場景下的通信抗干擾方法,其特征在于,包括具有預定面積的通信場景、在預定范圍內(nèi)可移動的發(fā)射機、固定設(shè)置的接收機以及干擾機,所述預定范圍位于所述通信場景內(nèi),所述接收機位于所述預定范圍內(nèi),所述干擾機在所述預定范圍外及所述通信場景內(nèi)可移動。