本發(fā)明涉及遙感圖像目標(biāo)檢測,具體涉及一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法。
背景技術(shù):
1、遙感圖像目標(biāo)檢測在城市規(guī)劃、災(zāi)害應(yīng)對、環(huán)境監(jiān)測和軍事偵察等領(lǐng)域具有廣泛應(yīng)用。傳統(tǒng)深度學(xué)習(xí)目標(biāo)檢測方法,如faster?r-cnn、yolo及retinanet等,在大規(guī)模標(biāo)注數(shù)據(jù)支持下取得了顯著進(jìn)展。然而,在遙感領(lǐng)域,標(biāo)注成本高昂且耗時,尤其對于小型目標(biāo)和稀有類別,更難以獲得充足的訓(xùn)練樣本。為此,小樣本目標(biāo)檢測(few-shot?objectdetection,?fsod)被提出,旨在在僅有極少量標(biāo)注樣本(通常為每類1至10張圖像)的前提下,實現(xiàn)對新類別的有效檢測。
2、現(xiàn)有技術(shù)存在以下不足之處:
3、在遙感圖像小樣本目標(biāo)檢測中,常出現(xiàn)跨尺度語義錯配的問題。該問題主要源自于支持樣本與查詢樣本在空間分辨率、目標(biāo)尺度及語義層級上的嚴(yán)重不一致。即便經(jīng)過統(tǒng)一的特征抽取網(wǎng)絡(luò)和空間對齊處理,支持圖像中提取的高層語義特征在目標(biāo)尺度較小時仍可能與查詢圖像中的同類目標(biāo)呈現(xiàn)出語義漂移現(xiàn)象,導(dǎo)致負(fù)向遷移。同時,模型在將支持樣本的特征遷移至查詢樣本時,不僅未能增強(qiáng)識別能力,反而因錯誤的語義關(guān)聯(lián)削弱了模型的判別能力。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是提供一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,以解決背景技術(shù)中不足。
2、為了實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,包括:
3、獲取查詢圖像和多個支持圖像,并分別輸入至并行的特征提取主干網(wǎng)絡(luò)中,提取多層次特征表示;
4、在淺層特征階段,采用雙分支編碼方式,分別對查詢特征和支持特征進(jìn)行鍵值映射,并基于特征相似性進(jìn)行動態(tài)注意權(quán)重計算,實現(xiàn)關(guān)鍵區(qū)域的特征對齊與融合;
5、在深層特征階段,針對與查詢目標(biāo)同類的正類支持圖像,構(gòu)建區(qū)域級語義相似性矩陣,結(jié)合自區(qū)分性圖加權(quán)計算區(qū)域間相似度,實現(xiàn)高層語義的對齊;
6、通過語義增強(qiáng)技術(shù)進(jìn)一步篩選支持特征中具有區(qū)分度的特征區(qū)域,并抑制背景干擾信息;
7、將經(jīng)多層次交互更新后的查詢特征輸入目標(biāo)檢測頭,完成目標(biāo)分類與邊界框回歸,輸出遙感圖像中的檢測結(jié)果。
8、優(yōu)選的,將待檢測的遙感圖像作為查詢圖像,并從訓(xùn)練集中選取m類中每類k張標(biāo)注樣本圖像作為支持圖像集合;其中,;
9、構(gòu)建具有相同結(jié)構(gòu)的雙分支主干網(wǎng)絡(luò),分別用于處理查詢圖像和支持圖像,所述主干網(wǎng)絡(luò)基于卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建;
10、將查詢圖像輸入至查詢分支網(wǎng)絡(luò),依次經(jīng)過多個卷積層,提取淺層特征、中層特征和深層特征;同理,將每張支持圖像輸入至支持分支網(wǎng)絡(luò),提取對應(yīng)的多尺度特征;對所有輸出的特征圖進(jìn)行通道歸一化處理。
11、優(yōu)選的,在淺層特征階段,提取得到的淺層查詢圖像特征表示為,支持圖像特征表示為,其中h、w為特征圖的空間尺寸,c為通道數(shù);
12、使用兩個獨立的卷積編碼器對查詢特征和支持圖像特征進(jìn)行投影變換,分別生成鍵和值映射:查詢圖像鍵、值映射:;支持圖像鍵、值映射:;其中,和均為1×1的卷積操作,將和展平為二維矩陣;其中,;計算查詢特征與支持特征之間的點對相似性權(quán)重。
13、優(yōu)選的,根據(jù)相似性權(quán)重,將支持圖像的值映射加權(quán)求和,融合到查詢特征中;
14、將原始查詢圖像的值映射與交互后的圖像特征拼接,并通過卷積整合:;其中:表示在通道維度上拼接,為1×1卷積層,是基于支持圖信息更新后的查詢特征表達(dá),最終輸出為交互增強(qiáng)后的查詢特征。
15、優(yōu)選的,在深層特征階段,查詢圖像深層特征,對查詢特征和每個正類支持特征進(jìn)行卷積編碼,提取語義對齊所需的鍵特征表示:查詢鍵映射:;每個支持圖像鍵映射:;其中:表示1×1卷積編碼器,是降維后的通道數(shù),hw和hw分別表示查詢圖像與支持圖像的展平空間維度;對每個正類支持圖像,計算其與查詢圖像之間所有區(qū)域的相似性得分矩陣。
16、優(yōu)選的,為了提升對具有顯著語義區(qū)域的關(guān)注度,引入支持圖像的自區(qū)分性圖:對每個支持圖像特征通過卷積操作提取區(qū)分性響應(yīng)圖;對相似性矩陣進(jìn)行加權(quán)調(diào)制,得到最終區(qū)域相似度;將所有正類支持圖像特征匯總為一個增強(qiáng)表示,并與查詢圖像進(jìn)行融合,加權(quán)聚合支持特征;最終輸出加權(quán)聚合支持特征包含查詢圖像原始語義與支持圖語義對齊后的增強(qiáng)信息。
17、優(yōu)選的,將支持圖像的深層特征表示為:;通過1×1卷積操作對通道進(jìn)行壓縮,獲得語義概括特征圖,突出關(guān)鍵語義區(qū)域;其中,;
18、基于生成語義注意力圖,用于表示各空間位置的語義重要性,表達(dá)式為:;其中:為帶有非線性激活的卷積操作,保證輸出權(quán)重值在(0,1)范圍內(nèi);將語義注意力圖作為權(quán)重,作用于原始的支持圖像特征,突出區(qū)分性區(qū)域并抑制低權(quán)值:;其中:表示逐位置通道廣播乘法;為增強(qiáng)后的支持圖語義特征;對增強(qiáng)后的支持特征進(jìn)行歸一化處理得到,最終輸出將作為后續(xù)深層語義交互或特征匹配的輸入。
19、優(yōu)選的,將經(jīng)過淺層交互與深層語義對齊處理后的查詢圖像特征,采用區(qū)域建議網(wǎng)絡(luò)在特征圖上生成多個候選目標(biāo)區(qū)域,即候選框區(qū)域;
20、對每個候選框區(qū)域,在特征圖中提取對應(yīng)區(qū)域的特征,進(jìn)行空間對齊并統(tǒng)一尺寸,將每個roi特征輸入目標(biāo)檢測頭,包括分類分支和回歸分支,分別進(jìn)行目標(biāo)類別預(yù)測與位置精修;
21、根據(jù)回歸偏移調(diào)整候選框的位置和尺寸,得到預(yù)測邊界框;對所有預(yù)測結(jié)果執(zhí)行非極大值抑制以去除重復(fù)預(yù)測,保留置信度最高的檢測結(jié)果,輸出為遙感圖像目標(biāo)檢測結(jié)果。
22、在上述技術(shù)方案中,本發(fā)明提供的技術(shù)效果和優(yōu)點:
23、1、本發(fā)明針對現(xiàn)有技術(shù)中支持圖像與查詢圖像在尺度、語義和空間結(jié)構(gòu)上的顯著差異所引發(fā)的語義錯配與負(fù)向遷移問題,構(gòu)建了從淺層到深層的多階段特征交互機(jī)制。通過在淺層特征階段引入雙分支編碼與動態(tài)注意力機(jī)制,實現(xiàn)關(guān)鍵區(qū)域的精確對齊;在深層階段構(gòu)建區(qū)域級語義相似矩陣,并結(jié)合支持圖像自區(qū)分性圖加權(quán)區(qū)域匹配,顯著提升了語義層級的一致性。同時,借助語義增強(qiáng)模塊對支持特征進(jìn)行語義重要性建模,有效壓制背景噪聲干擾,增強(qiáng)了目標(biāo)區(qū)域的判別能力。
24、2、本發(fā)明在小樣本條件下實現(xiàn)了對遙感圖像中復(fù)雜、多樣目標(biāo)的高精度檢測,尤其適用于目標(biāo)尺度小、類別不平衡、標(biāo)注困難的遙感應(yīng)用場景。該方法不僅提升了特征遷移的有效性,還增強(qiáng)了檢測模型對關(guān)鍵區(qū)域的聚焦能力和對復(fù)雜背景的魯棒性,在降低對大規(guī)模標(biāo)注數(shù)據(jù)依賴的同時,顯著提升了模型的泛化能力與實用性,具有較高的工程價值與應(yīng)用前景。
1.一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,其特征在于:包括:
2.根據(jù)權(quán)利要求1所述的一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,其特征在于:將待檢測的遙感圖像作為查詢圖像,并從訓(xùn)練集中選取m類中每類k張標(biāo)注樣本圖像作為支持圖像集合;其中,;
3.根據(jù)權(quán)利要求1所述的一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,其特征在于:在淺層特征階段,提取得到的淺層查詢圖像特征表示為,支持圖像特征表示為,其中h、w為特征圖的空間尺寸,c為通道數(shù);
4.根據(jù)權(quán)利要求3所述的一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,其特征在于:根據(jù)相似性權(quán)重,將支持圖像的值映射加權(quán)求和,融合到查詢特征中;
5.根據(jù)權(quán)利要求1所述的一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,其特征在于:在深層特征階段,查詢圖像深層特征,對查詢特征和每個正類支持特征進(jìn)行卷積編碼,提取語義對齊所需的鍵特征表示:查詢鍵映射:;每個支持圖像鍵映射:;其中:表示1×1卷積編碼器,是降維后的通道數(shù),hw和hw分別表示查詢圖像與支持圖像的展平空間維度;對每個正類支持圖像,計算其與查詢圖像之間所有區(qū)域的相似性得分矩陣。
6.根據(jù)權(quán)利要求5所述的一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,其特征在于:為了提升對具有顯著語義區(qū)域的關(guān)注度,引入支持圖像的自區(qū)分性圖:對每個支持圖像特征通過卷積操作提取區(qū)分性響應(yīng)圖;對相似性矩陣進(jìn)行加權(quán)調(diào)制,得到最終區(qū)域相似度;將所有正類支持圖像特征匯總為一個增強(qiáng)表示,并與查詢圖像進(jìn)行融合,加權(quán)聚合支持特征;最終輸出加權(quán)聚合支持特征包含查詢圖像原始語義與支持圖語義對齊后的增強(qiáng)信息。
7.根據(jù)權(quán)利要求1所述的一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,其特征在于:將支持圖像的深層特征表示為:;通過1×1卷積操作對通道進(jìn)行壓縮,獲得語義概括特征圖,突出關(guān)鍵語義區(qū)域;其中,;
8.根據(jù)權(quán)利要求7所述的一種基于多層次信息交互的小樣本遙感圖像目標(biāo)檢測算法,其特征在于:將經(jīng)過淺層交互與深層語義對齊處理后的查詢圖像特征,采用區(qū)域建議網(wǎng)絡(luò)在特征圖上生成多個候選目標(biāo)區(qū)域,即候選框區(qū)域;