一種面向復(fù)雜場景信息先驗的遙感圖像自然語言描述生成方法

文檔序號：41954928發(fā)布日期：2025-05-16 14:20閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種面向復(fù)雜場景信息先驗的遙感圖像自然語言描述生成方法

技術(shù)特征：

1.一種面向復(fù)雜場景信息先驗的遙感圖像自然語言描述生成方法，其特征在于，包括下列步驟：

2.如權(quán)利要求1所述的方法，其特征在于，步驟1包括：獲取公開的遙感圖像自然語言描述數(shù)據(jù)集作為初始數(shù)據(jù)集，基于初始數(shù)據(jù)集中的遙感圖像的英文描述得到英文數(shù)據(jù)集；基于英文數(shù)據(jù)集，采用匹配的中文進(jìn)行再次標(biāo)注，基于中文標(biāo)注構(gòu)建對應(yīng)的中文數(shù)據(jù)集。

3.如權(quán)利要求1所述的方法，其特征在于，步驟2中，預(yù)訓(xùn)練的骨干網(wǎng)絡(luò)為基于transformer的網(wǎng)絡(luò)結(jié)構(gòu)或基于卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)。

4.如權(quán)利要求1所述的方法，其特征在于，步驟2還包括對骨干網(wǎng)絡(luò)中的部分網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào)學(xué)習(xí)，其中，微調(diào)學(xué)習(xí)的部分網(wǎng)絡(luò)參數(shù)為用于提取深層編碼特征的網(wǎng)絡(luò)層的網(wǎng)路參數(shù)。

5.如權(quán)利要求1所述的方法，其特征在于，步驟2中，對多個尺度的淺層編碼特征，采用逐層融合法進(jìn)行多尺度淺層編碼特征融合，按照骨干網(wǎng)絡(luò)的前向傳播方向，依次遍歷每一個尺度的淺/深層編碼特征，通過卷積和下采樣操作將當(dāng)前尺度的淺/深層編碼特征的特征維度調(diào)整為后一淺/深層編碼特征的維度，再進(jìn)行特征疊加，再將當(dāng)前疊加后的淺/深層編碼特征作為新的后一淺/深層編碼特征，繼續(xù)該新的下一淺/深層編碼特征與其后一淺/深層編碼特征的特征調(diào)整和疊加，直到最后一個尺度的淺/深層編碼特征。

6.如權(quán)利要求1所述的方法，其特征在于，步驟3中，先驗信息構(gòu)建模塊的處理包括：

7.如權(quán)利要求1所述的方法，其特征在于，步驟4中，通過設(shè)置的全局特征強(qiáng)化模塊對視覺全局特征進(jìn)行強(qiáng)化處理，包括：

8.如權(quán)利要求1所述的方法，其特征在于，步驟4中，通過設(shè)置的局部特征強(qiáng)化模塊對視覺局部特征進(jìn)行強(qiáng)化處理，包括：

9.如權(quán)利要求1所述的方法，其特征在于，步驟5中多特征交叉融合器的具體執(zhí)行過程包括：

10.如權(quán)利要求9所述的方法，其特征在于，對增強(qiáng)后的視覺全局特征t和文本先驗特征p進(jìn)行聯(lián)合空間注意力操作，得到特征包括：

技術(shù)總結(jié)
本申請公開了一種面向復(fù)雜場景信息先驗的遙感圖像自然語言描述生成方法，屬于圖像處理與分析領(lǐng)域。本申請所提方法包括：構(gòu)建中文和英文聯(lián)合的數(shù)據(jù)集；構(gòu)建視覺的全局特征和局部特征；構(gòu)建信息先驗特征；對全局特征和局部特征的強(qiáng)化處理；進(jìn)行多特征交叉融合；對交叉融合后的特征執(zhí)行自然語言描述生成。本申請通過上述技術(shù)方案，提高了對涉及大量復(fù)雜場景的遙感圖像描述的準(zhǔn)確性。

技術(shù)研發(fā)人員：張藝杰,程建,巨奎霖,夏子瀛,范詩淼,何詩佳
受保護(hù)的技術(shù)使用者：電子科技大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/15

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種面向復(fù)雜場景信息先驗的遙感圖像自然語言描述生成方法