本發(fā)明屬于無(wú)線通信領(lǐng)域,具體涉及一種無(wú)人機(jī)搭載可重構(gòu)智能超表面輔助通信網(wǎng)絡(luò)優(yōu)化方法。
背景技術(shù):
1、隨著空域資源日益緊張,無(wú)人機(jī)(unmanned?aerial?vehicle,uav)作為低空經(jīng)濟(jì)的重要組成部分,憑借其高度機(jī)動(dòng)性和快速部署能力,已在應(yīng)急通信、信號(hào)覆蓋及智能交通等場(chǎng)景中得到廣泛應(yīng)用。與此同時(shí),可重構(gòu)智能超表面(reconfigurable?intelligentsurface,ris)作為一種關(guān)鍵技術(shù),通過(guò)對(duì)反射信號(hào)相位的動(dòng)態(tài)控制,能夠有效提升頻譜效率并降低能耗。然而,低空空域的復(fù)雜性往往會(huì)對(duì)通信質(zhì)量造成嚴(yán)重影響,傳統(tǒng)的uav或ris獨(dú)立部署難以有效應(yīng)對(duì)這一挑戰(zhàn)。通過(guò)將uav與ris融合,uav-ris輔助通信系統(tǒng)能夠增強(qiáng)傳輸?shù)目煽啃耘c適應(yīng)性,從而在低空經(jīng)濟(jì)的關(guān)鍵任務(wù)中確保穩(wěn)定高效的通信性能。
2、然而,在實(shí)際的空中ris部署中,由于uav在加速和減速過(guò)程中受到慣性阻力及空氣動(dòng)力效應(yīng)的影響,機(jī)身不可避免地發(fā)生傾斜,導(dǎo)致波束偏移和信道變化,從而降低了空中ris輔助通信的性能。此外,現(xiàn)有研究已表明,ris的實(shí)際增益對(duì)信號(hào)入射角和反射角高度敏感。盡管存在這些物理限制,當(dāng)前研究大多忽略了空中ris姿態(tài)變化的影響,導(dǎo)致系統(tǒng)性能未能達(dá)到空中ris增益的理論上界。這一持續(xù)性的建模缺陷嚴(yán)重限制了空中ris在實(shí)際應(yīng)用中的效果。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問(wèn)題是針對(duì)背景技術(shù)的不足提出了一種基于歐拉角的飛行控制范式,實(shí)現(xiàn)了空中ris的姿態(tài)優(yōu)化;通過(guò)歐拉角控制策略,該框架能夠在優(yōu)化姿態(tài)調(diào)整的同時(shí),進(jìn)行實(shí)時(shí)相位偏移補(bǔ)償,從而保持最優(yōu)波束對(duì)準(zhǔn)。
2、本發(fā)明為解決上述技術(shù)問(wèn)題采用以下技術(shù)方案:
3、一種針對(duì)空中ris姿態(tài)變化的通信網(wǎng)絡(luò)優(yōu)化方法,包含空中ris輔助的通信網(wǎng)絡(luò)場(chǎng)景,所述空中ris輔助的通信網(wǎng)絡(luò)場(chǎng)景包含基站與地面用戶的通信環(huán)境及uav-ris的控制環(huán)境;
4、所述基站與地面用戶的通信環(huán)境包含地面用戶集合與基站;在該環(huán)境下,基站在同一時(shí)刻可為多個(gè)地面用戶提供通信服務(wù);其中,基站與用戶間的通信鏈路分為兩種:直接鏈路和反射鏈路;所述直接鏈路為信號(hào)通過(guò)自由空間傳播直接傳輸?shù)降孛嬗脩?;所述反射鏈路為信?hào)自基站發(fā)出,經(jīng)過(guò)空中ris反射后,傳輸給地面用戶;
5、所述uav-ris的控制環(huán)境包含uav和ris陣列;在該控制環(huán)境下,無(wú)人機(jī)平臺(tái)作為載體,通過(guò)靈活的飛行能力,在基站與地面用戶之間提供空中信號(hào)反射中繼;在飛行和懸停過(guò)程中,無(wú)人機(jī)受慣性及空氣阻力的影響,其機(jī)身姿態(tài)包括滾轉(zhuǎn)角、俯仰角和偏航角會(huì)動(dòng)態(tài)變化,進(jìn)而導(dǎo)致ris反射角度和信號(hào)入射角的偏移,從而引起波束對(duì)準(zhǔn)誤差和信道增益波動(dòng),直接影響反射鏈路的通信性能;
6、具體包括如下步驟:
7、步驟1,無(wú)人機(jī)搭載ris懸?;蝻w行在地面用戶上空;基站通過(guò)下行鏈路向空中ris發(fā)送通信信號(hào),ris通過(guò)實(shí)時(shí)相位調(diào)控對(duì)信號(hào)進(jìn)行反射增強(qiáng)和波束調(diào)整,確保反射信號(hào)精準(zhǔn)對(duì)準(zhǔn)目標(biāo)用戶方向;通過(guò)反射鏈路將優(yōu)化后的信號(hào)傳遞給地面用戶;
8、步驟2,為了應(yīng)對(duì)uav姿態(tài)變化,包括滾轉(zhuǎn)角、俯仰角和偏航角,對(duì)接收和反射信號(hào)的角度影響,即對(duì)系統(tǒng)通信性能的影響,基于軟演員評(píng)論家(soft?actor-critic,sac)深度強(qiáng)化學(xué)習(xí)方法來(lái)聯(lián)合優(yōu)化uav的姿態(tài)和ris相移,從而最大化系統(tǒng)通信速率和;
9、步驟3,在每個(gè)時(shí)隙 l,通過(guò)對(duì)空中ris姿態(tài)和uav軌跡的狀態(tài)分析,確定最優(yōu)策略,uav根據(jù)得出的最優(yōu)策略進(jìn)行下一步的動(dòng)作展開(kāi)。
10、作為本發(fā)明一種針對(duì)空中ris姿態(tài)變化的通信網(wǎng)絡(luò)優(yōu)化方法的進(jìn)一步優(yōu)選方案,在步驟1中,環(huán)境采用三維笛卡爾坐標(biāo)系,uav在固定高度水平飛行,地面用戶隨機(jī)分布。
11、作為本發(fā)明一種針對(duì)空中ris姿態(tài)變化的通信網(wǎng)絡(luò)優(yōu)化方法的進(jìn)一步優(yōu)選方案,在步驟2中,接收和反射信號(hào)的角度將由歐拉角表示,從而表示接收和反射波束,計(jì)算出系統(tǒng)通信速率和;基于sac深度強(qiáng)化學(xué)習(xí)方法是通過(guò)最大熵策略來(lái)提升探索效率,使得在策略評(píng)估和策略改進(jìn)階段能夠平衡探索與利用。
12、作為本發(fā)明一種針對(duì)空中ris姿態(tài)變化的通信網(wǎng)絡(luò)優(yōu)化方法的進(jìn)一步優(yōu)選方案,在步驟3中,最優(yōu)策略包括:根據(jù)當(dāng)前環(huán)境,調(diào)整uav的飛行軌跡和空中ris的姿態(tài),從而確保最優(yōu)信號(hào)入射角和反射角,進(jìn)而最大化ris的信道增益,提升系統(tǒng)的通信性能。
13、本發(fā)明采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果:
14、1、本發(fā)明一種基于歐拉角的空中ris控制方法,以聯(lián)合優(yōu)化uav軌跡和空中ris姿態(tài),采用深度強(qiáng)化學(xué)習(xí)算法,以最大化系統(tǒng)通信速率和;本發(fā)明考慮了空中ris姿態(tài)與uav軌跡之間的耦合關(guān)系,以及ris信道增益與朝向之間的聯(lián)系,使應(yīng)用場(chǎng)景更符合顯示情況,應(yīng)用到實(shí)際場(chǎng)景中可以取得較好的效果;
15、2、本發(fā)明提出的sac算法不僅關(guān)注累積獎(jiǎng)勵(lì)的最大化,還將策略熵作為關(guān)鍵優(yōu)化目標(biāo)之一;該算法旨在最大化累積獎(jiǎng)勵(lì)與策略熵的加權(quán)和,通過(guò)引入策略隨機(jī)性,鼓勵(lì)智能體在動(dòng)作選擇時(shí)具備更高的探索能力。
1.一種針對(duì)空中ris姿態(tài)變化的通信網(wǎng)絡(luò)優(yōu)化方法,其特征在于:包含空中ris輔助的通信網(wǎng)絡(luò)場(chǎng)景,所述空中ris輔助的通信網(wǎng)絡(luò)場(chǎng)景包含基站與地面用戶的通信環(huán)境及uav-ris的控制環(huán)境;
2.根據(jù)權(quán)利要求1所述的一種針對(duì)空中ris姿態(tài)變化的通信網(wǎng)絡(luò)優(yōu)化方法,其特征在于:在步驟1中,環(huán)境采用三維笛卡爾坐標(biāo)系,uav在固定高度水平飛行,地面用戶隨機(jī)分布。
3.根據(jù)權(quán)利要求1所述的一種針對(duì)空中ris姿態(tài)變化的通信網(wǎng)絡(luò)優(yōu)化方法,其特征在于:在步驟2中,接收和反射信號(hào)的角度將由歐拉角表示,從而表示接收和反射波束,計(jì)算出系統(tǒng)通信速率和;基于sac深度強(qiáng)化學(xué)習(xí)方法是通過(guò)最大熵策略來(lái)提升探索效率,使得在策略評(píng)估和策略改進(jìn)階段能夠平衡探索與利用。
4.根據(jù)權(quán)利要求1所述的一種針對(duì)空中ris姿態(tài)變化的通信網(wǎng)絡(luò)優(yōu)化方法,其特征在于:在步驟3中,最優(yōu)策略包括:根據(jù)當(dāng)前環(huán)境,調(diào)整uav的飛行軌跡和空中ris的姿態(tài),從而確保最優(yōu)信號(hào)入射角和反射角,進(jìn)而最大化ris的信道增益,提升系統(tǒng)的通信性能。