本技術(shù)涉及數(shù)據(jù)傳輸,特別是涉及一種星地?cái)?shù)據(jù)傳輸方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、星地協(xié)作技術(shù)的基本原理基于衛(wèi)星與地面站之間的協(xié)同工作,以實(shí)現(xiàn)高效的數(shù)據(jù)傳輸、資源共享和任務(wù)執(zhí)行。星地協(xié)作的關(guān)鍵在于通過(guò)合理設(shè)計(jì)的通信協(xié)議和高效的協(xié)作機(jī)制,確保衛(wèi)星和地面站能夠?qū)崟r(shí)交換數(shù)據(jù),優(yōu)化系統(tǒng)的整體性能。衛(wèi)星在軌期間需要將采集到的數(shù)據(jù)傳輸?shù)降孛嬲荆蚪邮盏孛嬲镜闹噶顖?zhí)行特定任務(wù)。這一過(guò)程要求數(shù)據(jù)傳輸?shù)母呖煽啃院偷脱舆t。星地協(xié)作技術(shù)通過(guò)多種傳輸鏈路(如x波段、ka波段)和多頻段通信技術(shù),確保數(shù)據(jù)的實(shí)時(shí)性和完整性。星地協(xié)作允許地面站和衛(wèi)星之間進(jìn)行資源的合理分配與優(yōu)化。例如,地面站可以為衛(wèi)星提供實(shí)時(shí)計(jì)算能力支持,減輕衛(wèi)星的計(jì)算負(fù)擔(dān),提高任務(wù)執(zhí)行的效率。通過(guò)這種方式,衛(wèi)星可以在不增加硬件負(fù)擔(dān)的情況下,完成更復(fù)雜的任務(wù)。
2、在相關(guān)技術(shù)中,存在一種基于信道狀態(tài)信息(csi,channel?state?information)的動(dòng)態(tài)資源分配技術(shù),能夠通過(guò)實(shí)時(shí)獲取通信信道中的關(guān)鍵參數(shù)(如信道增益、噪聲水平等),動(dòng)態(tài)調(diào)整資源分配策略的技術(shù)。在該技術(shù)中,系統(tǒng)利用csi對(duì)衛(wèi)星與地面站之間的信道條件進(jìn)行實(shí)時(shí)監(jiān)測(cè),通過(guò)對(duì)信道的瞬時(shí)狀態(tài)進(jìn)行分析,根據(jù)環(huán)境變化動(dòng)態(tài)分配帶寬資源和發(fā)射功率,以優(yōu)化傳輸性能。
3、例如,當(dāng)信道條件較好時(shí),系統(tǒng)會(huì)降低發(fā)射功率以節(jié)約能耗,或在帶寬資源富余的情況下提高傳輸速率;而在信道狀態(tài)較差時(shí),系統(tǒng)則會(huì)增加發(fā)射功率或調(diào)整帶寬資源,以確保通信鏈路的穩(wěn)定性。csi動(dòng)態(tài)資源分配技術(shù)適用于通信環(huán)境波動(dòng)較大的衛(wèi)星通信場(chǎng)景,其設(shè)計(jì)的核心在于根據(jù)信道反饋信息實(shí)時(shí)調(diào)節(jié)資源,實(shí)現(xiàn)通信效率的動(dòng)態(tài)優(yōu)化。
4、這種基于信道狀態(tài)信息(csi)的動(dòng)態(tài)資源分配技術(shù)在一定程度上能夠優(yōu)化衛(wèi)星通信中的帶寬資源和發(fā)射功率使用,但該技術(shù)存在局限性,尤其在復(fù)雜時(shí)空環(huán)境下表現(xiàn)出明顯不足。
5、首先,csi技術(shù)主要依賴于信道增益、噪聲水平等單一信道反饋信息,難以全面捕捉衛(wèi)星和地面站之間的動(dòng)態(tài)相對(duì)位置、距離變化和軌道因素帶來(lái)的影響。因此,該技術(shù)在衛(wèi)星和地面站高速移動(dòng)或位置變化顯著時(shí),可能無(wú)法快速適應(yīng)信道特性的波動(dòng),導(dǎo)致資源分配不準(zhǔn)確。
6、其次,csi技術(shù)缺乏對(duì)多維時(shí)空特征的高精度感知和預(yù)測(cè)手段,未能整合多源數(shù)據(jù)如gps、慣性測(cè)量(imu,inertial?measurement?unit)等傳感器的時(shí)空信息,這限制了系統(tǒng)在復(fù)雜動(dòng)態(tài)環(huán)境中的適應(yīng)性。
7、再者,由于沒(méi)有采用深度強(qiáng)化學(xué)習(xí)或自適應(yīng)優(yōu)化算法,csi技術(shù)缺少應(yīng)對(duì)突發(fā)環(huán)境變化的智能性,無(wú)法靈活優(yōu)化資源分配策略。因此,盡管csi技術(shù)在靜態(tài)或變化較小的信道環(huán)境中表現(xiàn)良好,但在需要高精度、動(dòng)態(tài)響應(yīng)的衛(wèi)星通信場(chǎng)景中,其效能有限,難以達(dá)到最佳的傳輸效率和能量管理效果。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本技術(shù)實(shí)施例提供一種星地?cái)?shù)據(jù)傳輸方法、裝置、設(shè)備及介質(zhì),以便克服上述問(wèn)題或者至少部分地解決上述問(wèn)題。
2、本技術(shù)實(shí)施例第一方面提供了一種星地?cái)?shù)據(jù)傳輸方法,所述方法包括:
3、采集衛(wèi)星的歷史時(shí)空數(shù)據(jù),所述歷史時(shí)空數(shù)據(jù)包括:所述衛(wèi)星歷史的gps位置信息、imu加速度數(shù)據(jù)和天線方向角數(shù)據(jù);
4、根據(jù)所述歷史時(shí)空數(shù)據(jù),采用lstm網(wǎng)絡(luò)預(yù)測(cè)出所述衛(wèi)星的未來(lái)時(shí)空數(shù)據(jù);
5、基于所述未來(lái)時(shí)空數(shù)據(jù)生成未來(lái)狀態(tài)向量;所述未來(lái)狀態(tài)向量包括:規(guī)定的時(shí)間窗口的剩余時(shí)間、數(shù)據(jù)包的剩余數(shù)據(jù)量、信道增益、當(dāng)前時(shí)刻分配的帶寬資源、當(dāng)前時(shí)刻分配的發(fā)射功率和所述衛(wèi)星所在的當(dāng)前位置的噪聲發(fā)射功率譜密度;
6、將所述未來(lái)狀態(tài)向量輸入到預(yù)先訓(xùn)練好的資源分配模型中,得到所述資源分配模型輸出的資源分配方案;所述資源分配模型是以所述衛(wèi)星歷史的狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)以及下一個(gè)狀態(tài)為訓(xùn)練樣本,并基于深度強(qiáng)化學(xué)習(xí)算法訓(xùn)練得到的;所述動(dòng)作指的是在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案,所述獎(jiǎng)勵(lì)指的是所述衛(wèi)星執(zhí)行在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案后的即時(shí)獎(jiǎng)勵(lì),所述下一個(gè)狀態(tài)指的是所述衛(wèi)星執(zhí)行在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案后的狀態(tài);
7、當(dāng)所述資源分配方案滿足約束條件時(shí),將所述資源分配方案應(yīng)用于所述衛(wèi)星的未來(lái)時(shí)刻,所述約束條件用于對(duì)所述衛(wèi)星在數(shù)據(jù)傳輸過(guò)程中的通信延遲、帶寬資源以及發(fā)射功率控制進(jìn)行約束。
8、可選地,所述方法還包括:
9、當(dāng)所述資源分配方案不滿足約束條件時(shí),對(duì)所述資源分配方案進(jìn)行重新調(diào)整;
10、其中,對(duì)所述通信延遲進(jìn)行約束表示:所述衛(wèi)星的傳輸總數(shù)據(jù)量必須在所述規(guī)定的時(shí)間窗口內(nèi)完成,所述通信延遲的約束表達(dá)式為:
11、;
12、對(duì)所述帶寬資源進(jìn)行約束表示:在當(dāng)前時(shí)刻t使用的帶寬資源必須在可用帶寬資源范圍內(nèi),所述帶寬資源的約束表達(dá)式為:
13、;
14、對(duì)所述發(fā)射功率控制進(jìn)行約束表示:在當(dāng)前時(shí)刻t使用的發(fā)射功率必須在所述衛(wèi)星和地面站的發(fā)射功率范圍內(nèi),所述發(fā)射功率控制的約束表達(dá)式為:
15、;
16、其中,表示所述衛(wèi)星的傳輸總數(shù)據(jù)量的時(shí)間窗口,為傳輸速率,用于表示在當(dāng)前時(shí)刻t下實(shí)際傳輸?shù)臄?shù)據(jù)量。
17、可選地,在訓(xùn)練所述資源分配模型之前,還包括:
18、獲取所述衛(wèi)星在軌道的各個(gè)位置的真實(shí)時(shí)空數(shù)據(jù);所述真實(shí)時(shí)空數(shù)據(jù)包括:所述衛(wèi)星真實(shí)的gps位置信息、真實(shí)的imu加速度數(shù)據(jù)和真實(shí)的天線方向角數(shù)據(jù);
19、根據(jù)所述真實(shí)的天線方向角數(shù)據(jù),獲取信道的相位變化;
20、通過(guò)所述真實(shí)的gps位置信息,計(jì)算動(dòng)態(tài)距離;所述;
21、其中,、、分別為所述衛(wèi)星的三維坐標(biāo);、、分別為所述地面站的三維坐標(biāo);
22、根據(jù)所述動(dòng)態(tài)距離、固定增益常數(shù)、路徑損耗指數(shù)n、衰減因子經(jīng)驗(yàn)常數(shù)、信道的相位變化、波長(zhǎng),確定出信道增益;所述信道增益的計(jì)算公式為:;
23、根據(jù)所述傳輸總數(shù)據(jù)量和傳輸速率r(t),基于公式,確定出傳輸數(shù)據(jù)剩余量;
24、根據(jù)時(shí)間窗口的總時(shí)間和當(dāng)前時(shí)刻t,基于公式,確定出時(shí)間窗口的剩余時(shí)間;
25、根據(jù)所述真實(shí)的gps位置信息,確定出當(dāng)前位置噪聲發(fā)射功率譜密度;
26、根據(jù)所述剩余時(shí)間、所述傳輸數(shù)據(jù)剩余量、所述信道增益、所述當(dāng)前位置噪聲發(fā)射功率譜密度,以及當(dāng)前的時(shí)刻分配的帶寬資源和發(fā)射功率,確定出狀態(tài)向量s(t),s(t)通過(guò)多維向量表示,所述多個(gè)狀態(tài)向量s(t)構(gòu)成狀態(tài)空間。
27、可選地,在訓(xùn)練所述資源分配模型之前,還包括:
28、將發(fā)射功率以第一間隔進(jìn)行離散枚舉,得到多個(gè)離散的發(fā)射功率;
29、將可分配的帶寬資源范圍以第二間隔進(jìn)行離散枚舉,得到多個(gè)離散的帶寬資源;
30、將所述離散的發(fā)射功率和所述離散的帶寬資源進(jìn)行組合,得到動(dòng)作空間;
31、其中,所述動(dòng)作空間中包含:多個(gè)離散的發(fā)射功率和多個(gè)離散的帶寬資源組成的多個(gè)動(dòng)作。
32、可選地,在訓(xùn)練所述資源分配模型之前,還包括:
33、設(shè)置獎(jiǎng)勵(lì)函數(shù),所述獎(jiǎng)勵(lì)函數(shù)為:
34、;
35、;
36、其中,w(t,s)表示所述衛(wèi)星在狀態(tài)s下,執(zhí)行動(dòng)作a的能量消耗;penalty表示懲罰項(xiàng);為懲罰因子;為所述衛(wèi)星的傳輸總數(shù)據(jù)量;
37、能量消耗w(t,s)的影響因素的推導(dǎo)過(guò)程如下:
38、根據(jù)所述發(fā)射功率確定w(t,s),表達(dá)式為:
39、;
40、其中,為時(shí)間窗口,為發(fā)射功率,t為當(dāng)前時(shí)刻;
41、根據(jù)通信時(shí)間由公式計(jì)算可知,d為傳輸數(shù)據(jù)量,c為信道容量,且;
42、其中,s為信號(hào)功率,由公式表示,為信道增益,信道增益是根據(jù)公式得到的;
43、其中,為固定增益常數(shù),為隨時(shí)間和空間變化的衰減因子經(jīng)驗(yàn)常數(shù),為衛(wèi)星與地面站之間的動(dòng)態(tài)距離,n為路徑損耗指數(shù),為信道的相位變化;
44、 n為噪聲功率,由表示,為噪聲功率譜密度,b為帶寬資源;
45、確定出。
46、可選地,在訓(xùn)練所述資源分配模型之前,還包括:
47、定義所述資源分配模型的深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),其中,所述深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的輸入層為狀態(tài)向量s(t);輸出層為所述動(dòng)作空間中的動(dòng)作;
48、構(gòu)建經(jīng)驗(yàn)回放池,所述經(jīng)驗(yàn)回放池用于存儲(chǔ)多個(gè)訓(xùn)練樣本,每個(gè)訓(xùn)練樣本為一個(gè)元組,所述元組包括衛(wèi)星的狀態(tài)s、動(dòng)作a、獎(jiǎng)勵(lì)r以及下一個(gè)狀態(tài),所述訓(xùn)練樣本是基于所述狀態(tài)空間中的狀態(tài)向量s(t)、所述動(dòng)作空間中的動(dòng)作、執(zhí)行動(dòng)作得到的獎(jiǎng)勵(lì),以及執(zhí)行動(dòng)作后的下一個(gè)狀態(tài)確定出的。
49、可選地,所述資源分配模型訓(xùn)練過(guò)程如下:
50、從所述經(jīng)驗(yàn)回放池中的多個(gè)訓(xùn)練樣本中抽取小批量訓(xùn)練樣本,通過(guò)所述小批量訓(xùn)練樣本訓(xùn)練待訓(xùn)練的資源分配模型;在每個(gè)時(shí)間步,使用epsilon-greedy策略選擇動(dòng)作空間中的動(dòng)作:以的概率從動(dòng)作空間中隨機(jī)選擇一個(gè)動(dòng)作,以的概率選擇從所述動(dòng)作空間中選擇當(dāng)前值最大的動(dòng)作;
51、設(shè)置目標(biāo)函數(shù),所述用于表示所述資源分配模型選擇動(dòng)作a后,所述衛(wèi)星在狀態(tài)s下采取所述動(dòng)作a后的期望累積獎(jiǎng)勵(lì);
52、其中,;
53、;
54、其中,e表示計(jì)算期望;s表示所述衛(wèi)星的當(dāng)前狀態(tài);a表示所述衛(wèi)星的在狀態(tài)s下選擇的動(dòng)作;是折扣因子;表示所述衛(wèi)星在深度強(qiáng)化學(xué)習(xí)過(guò)程的初始狀態(tài);表示所述衛(wèi)星在初始狀態(tài)下采取的第一個(gè)動(dòng)作;表示所述衛(wèi)星是傳輸總數(shù)據(jù)量;
55、對(duì)于每個(gè)訓(xùn)練樣本,計(jì)算目標(biāo)值y,所述目標(biāo)值y為:在狀態(tài)s下采取所述動(dòng)作a后的即時(shí)獎(jiǎng)勵(lì)和下一狀態(tài)下采取最優(yōu)動(dòng)作的最大期望回報(bào)之和,所述目標(biāo)值y的計(jì)算公式為:
56、;
57、其中,為折扣因子,用于衡量未來(lái)獎(jiǎng)勵(lì)的影響力范圍;表示從下一個(gè)狀態(tài)開(kāi)始,采取最優(yōu)動(dòng)作時(shí)的最大期望回報(bào);
58、將所述目標(biāo)值y作為對(duì)進(jìn)行迭代更新的目標(biāo),從而訓(xùn)練所述資源分配模型,使得接近實(shí)際的動(dòng)作價(jià)值函數(shù),其中,迭代更新的過(guò)程為:
59、;
60、β為學(xué)習(xí)率,表示q(s ,a)更新的步長(zhǎng);
61、在訓(xùn)練的過(guò)程中,使用均方誤差作為損失函數(shù),所述損失函數(shù)的計(jì)算公式為:
62、;
63、其中,n表示所述小批量樣本的數(shù)量,是所述資源分配模型的當(dāng)前參數(shù),表示所述資源分配模型基于所述當(dāng)前參數(shù)在第j個(gè)訓(xùn)練樣本中的狀態(tài)下采取在第j個(gè)訓(xùn)練樣本中的動(dòng)作后的期望累積獎(jiǎng)勵(lì);表示在第j個(gè)訓(xùn)練樣本中的狀態(tài)下采取在第j個(gè)訓(xùn)練樣本中的動(dòng)作后的即時(shí)獎(jiǎng)勵(lì)和狀態(tài)的下一狀態(tài)下采取最優(yōu)動(dòng)作的最大期望回報(bào)之和。
64、本技術(shù)實(shí)施例第二方面提供了一種星地?cái)?shù)據(jù)傳輸裝置,所述裝置包括:
65、采集模塊,用于采集衛(wèi)星的歷史時(shí)空數(shù)據(jù),所述歷史時(shí)空數(shù)據(jù)包括:所述衛(wèi)星歷史的gps位置信息、imu加速度數(shù)據(jù)和天線方向角數(shù)據(jù);
66、預(yù)測(cè)模塊,用于根據(jù)所述歷史時(shí)空數(shù)據(jù),采用lstm網(wǎng)絡(luò)預(yù)測(cè)出所述衛(wèi)星的未來(lái)時(shí)空數(shù)據(jù);
67、未來(lái)狀態(tài)向量生成模塊,用于基于所述未來(lái)時(shí)空數(shù)據(jù)生成未來(lái)狀態(tài)向量;所述未來(lái)狀態(tài)向量包括:規(guī)定的時(shí)間窗口的剩余時(shí)間、數(shù)據(jù)包的剩余數(shù)據(jù)量、信道增益、當(dāng)前時(shí)刻分配的帶寬資源、當(dāng)前時(shí)刻分配的發(fā)射功率和所述衛(wèi)星所在的當(dāng)前位置的噪聲發(fā)射功率譜密度;
68、執(zhí)行模塊,用于將所述未來(lái)狀態(tài)向量輸入到預(yù)先訓(xùn)練好的資源分配模型中,得到所述資源分配模型輸出的資源分配方案;所述資源分配模型是以所述衛(wèi)星歷史的狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)以及下一個(gè)狀態(tài)為訓(xùn)練樣本,并基于深度強(qiáng)化學(xué)習(xí)算法訓(xùn)練得到的;所述動(dòng)作指的是在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案,所述獎(jiǎng)勵(lì)指的是所述衛(wèi)星執(zhí)行在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案后的即時(shí)獎(jiǎng)勵(lì),所述下一個(gè)狀態(tài)指的是所述衛(wèi)星執(zhí)行在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案后的狀態(tài);
69、應(yīng)用模塊,用于當(dāng)所述資源分配方案滿足約束條件時(shí),將所述資源分配方案應(yīng)用于所述衛(wèi)星的未來(lái)時(shí)刻,所述約束條件用于對(duì)所述衛(wèi)星在數(shù)據(jù)傳輸過(guò)程中的通信延遲、帶寬資源以及發(fā)射功率控制進(jìn)行約束。
70、本技術(shù)實(shí)施例第三方面,提供一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,其中,所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)如第一方面所述的方法。
71、本技術(shù)實(shí)施例第四方面,提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的方法。
72、本技術(shù)的有益效果:
73、本技術(shù)提供一種星地?cái)?shù)據(jù)傳輸方法、裝置、設(shè)備及介質(zhì),該方法包括:采集衛(wèi)星的歷史時(shí)空數(shù)據(jù),所述歷史時(shí)空數(shù)據(jù)包括:所述衛(wèi)星歷史的gps位置信息、imu加速度數(shù)據(jù)和天線方向角數(shù)據(jù);根據(jù)所述歷史時(shí)空數(shù)據(jù),采用lstm網(wǎng)絡(luò)預(yù)測(cè)出所述衛(wèi)星的未來(lái)時(shí)空數(shù)據(jù);基于所述未來(lái)時(shí)空數(shù)據(jù)生成未來(lái)狀態(tài)向量;所述未來(lái)狀態(tài)向量包括:規(guī)定的時(shí)間窗口的剩余時(shí)間、數(shù)據(jù)包的剩余數(shù)據(jù)量、信道增益、當(dāng)前時(shí)刻分配的帶寬資源、當(dāng)前時(shí)刻分配的發(fā)射功率和所述衛(wèi)星所在的當(dāng)前位置的噪聲發(fā)射功率譜密度;將所述未來(lái)狀態(tài)向量輸入到預(yù)先訓(xùn)練好的資源分配模型中,得到所述資源分配模型輸出的資源分配方案;所述資源分配模型是以所述衛(wèi)星歷史的狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)以及下一個(gè)狀態(tài)為訓(xùn)練樣本,并基于深度強(qiáng)化學(xué)習(xí)算法訓(xùn)練得到的;所述動(dòng)作指的是在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案,所述獎(jiǎng)勵(lì)指的是所述衛(wèi)星執(zhí)行在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案后的即時(shí)獎(jiǎng)勵(lì),所述下一個(gè)狀態(tài)指的是所述衛(wèi)星執(zhí)行在所述狀態(tài)下對(duì)衛(wèi)星的資源分配方案后的狀態(tài);當(dāng)所述資源分配方案滿足約束條件時(shí),將所述資源分配方案應(yīng)用于所述衛(wèi)星的未來(lái)時(shí)刻,所述約束條件用于對(duì)所述衛(wèi)星在數(shù)據(jù)傳輸過(guò)程中的通信延遲、帶寬資源以及發(fā)射功率控制進(jìn)行約束。
74、通過(guò)本技術(shù)的技術(shù)方案,能夠利用lstm網(wǎng)絡(luò)對(duì)衛(wèi)星的歷史時(shí)空數(shù)據(jù)進(jìn)行分析和預(yù)測(cè),可以顯著提高對(duì)未來(lái)時(shí)空數(shù)據(jù)的預(yù)測(cè)精度,基于深度強(qiáng)化學(xué)習(xí)訓(xùn)練得到的資源分配模型能夠根據(jù)未來(lái)狀態(tài)向量動(dòng)態(tài)調(diào)整資源分配方案,實(shí)現(xiàn)在滿足通信延遲、帶寬資源和發(fā)射功率控制等約束條件下的最優(yōu)資源分配,通過(guò)深度強(qiáng)化學(xué)習(xí)算法訓(xùn)練的資源分配模型,可以在保證數(shù)據(jù)傳輸任務(wù)的同時(shí)最小化能耗,提高傳輸效率,適應(yīng)復(fù)雜的時(shí)空環(huán)境變化,提高系統(tǒng)在面對(duì)動(dòng)態(tài)變化時(shí)的適應(yīng)性和魯棒性,為星地之間的通信發(fā)展提供了強(qiáng)有力的技術(shù)支持。