本發(fā)明涉及計算機視覺,特別是涉及一種用于遙感圖像的旋轉(zhuǎn)目標(biāo)檢測方法。
背景技術(shù):
1、遙感圖像的旋轉(zhuǎn)目標(biāo)檢測是指從遙感圖像中使用帶角度的旋轉(zhuǎn)矩形框回歸目標(biāo)的位置并實現(xiàn)目標(biāo)的分類。該任務(wù)在城市規(guī)劃、農(nóng)業(yè)、軍事行動等領(lǐng)域具有很廣泛的應(yīng)用前景,是計算機視覺領(lǐng)域一個非常有價值的研究方向。遙感目標(biāo)檢測以單張rgb遙感圖像作為輸入,并預(yù)測圖像中感興趣的區(qū)域(如橋梁、車輛、船只、港口等),輸出這些目標(biāo)的位置和類別參數(shù)。傳統(tǒng)的遙感目標(biāo)檢測方法主要依賴人工設(shè)計的特征和基于機器學(xué)習(xí)的分類器,例如使用紋理分析、閾值分割或邊緣檢測等方法。然而,這些方法對復(fù)雜場景的適應(yīng)能力較弱,在面對目標(biāo)尺度變化、背景干擾以及密集排列等問題時,往往無法取得令人滿意的效果。以卷積神經(jīng)網(wǎng)絡(luò)(cnn)為代表的深度學(xué)習(xí)技術(shù)能夠自動學(xué)習(xí)圖像中的高級特征,顯著提升了目標(biāo)檢測的精度和魯棒性。當(dāng)前主流的遙感目標(biāo)檢測框架通常借助通用的深度學(xué)習(xí)主干網(wǎng)絡(luò)(如vgg、resnet或efficientnet)進行特征提取,并結(jié)合目標(biāo)檢測算法(如faster?r-cnn、yolo、retinanet等)完成檢測任務(wù)。然而,遙感圖像特有的復(fù)雜性使得現(xiàn)有技術(shù)在實際應(yīng)用中仍面臨諸多挑戰(zhàn)。例如,遙感圖像中的目標(biāo)具有顯著的尺度差異,小目標(biāo)(如車輛、船只)和大目標(biāo)(如建筑物、橋梁)需要同時被精準(zhǔn)識別,目標(biāo)排列密集并且目標(biāo)框旋轉(zhuǎn)角度任意,然而常規(guī)特征提取網(wǎng)絡(luò)在處理小目標(biāo)和密集目標(biāo)時存在局限性。此外,模型對目標(biāo)的多尺度敏感性直接影響到目標(biāo)檢測的精準(zhǔn)度,主流的提升目標(biāo)尺度敏感性的方法主要依靠特征金字塔網(wǎng)絡(luò)來交互傳遞尺度信息。這種方法雖然能提升網(wǎng)絡(luò)對目標(biāo)的尺度感知能力,但交互過程中帶來的特征丟失和退化也較為明顯。綜上,當(dāng)前技術(shù)領(lǐng)域仍然存在諸多不足。
技術(shù)實現(xiàn)思路
1、為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于遙感圖像的旋轉(zhuǎn)目標(biāo)檢測方法。
2、本發(fā)明所采用的技術(shù)方案是:
3、一種基于遙感圖像的旋轉(zhuǎn)目標(biāo)檢測方法,所述方法包括以下步驟:
4、s1、通過由目標(biāo)姿態(tài)引導(dǎo)特征獲取模塊組成的特征提取主干,提取遙感圖像的特征:通過由姿態(tài)引導(dǎo)特征獲取模塊tp-gfa組成的特征提取主干,對單張rgb遙感圖像進行特征提取,該主干采用卷積串行結(jié)構(gòu)提取圖像特征,得到一系列在空間分辨率和通道數(shù)上各不相同的特征圖序列;
5、s2、根據(jù)s1中提取到的一系列特征圖序列,選取后三層特征作為增強路徑特征金字塔網(wǎng)絡(luò)epfpn的輸入;epfpn采用多路徑特征金字塔設(shè)計充分聚合特征,并且通過橫向連接的方式,將原始輸入與輸出融合,彌補特征交互過程中自下而上路徑中的原始信息的損失;所述橫向連接指的是將原始輸入特征與輸出特征融合,彌補特征交互過程中自下而上路徑中的原始信息的損失;
6、s3、將步驟s2中每一次拼接之后的特征,通過特征細化模塊rfca以特征重構(gòu)的方式優(yōu)化拼接后的特征,確保特征充分融合并彌補類間特征差異,并將優(yōu)化后的特征送入分類頭和回歸頭中,得到最終的目標(biāo)檢測結(jié)果。
7、進一步地,步驟s1中所述的姿態(tài)引導(dǎo)特征獲取模塊,是借助可變形卷積的思想,引入可學(xué)習(xí)的偏移量,使得卷積核的采樣位置能夠自適應(yīng)調(diào)整,感知遙感目標(biāo)的幾何形狀和姿態(tài)變化,以適應(yīng)遙感圖像中目標(biāo)方向任意的特點,并得到富含目標(biāo)形態(tài)的特征表示;接著將富含形態(tài)表示的特征經(jīng)過多層感知機(multilayer?perceptron,mlp)回歸得到方向參數(shù)θ;方向參數(shù)θ用于為旋轉(zhuǎn)卷積提供方向指示,進一步提取目標(biāo)的細粒度特征,兩者共同促進對遙感目標(biāo)的特征提取能力,可公式化表達為:
8、θ=σ(mlp(maxpool(f))),
9、w'=rotatematrix(w,θ),
10、mh(f)=σ(mlp(avgpool(f))+mlp(maxpool(f))),
11、y(final)=mh(f)⊙conv2d(x,w'),
12、其中,σ是激活函數(shù)sigmoid,maxpool表示最大池化操作,mlp為多層感知機,用于回歸方向參數(shù)θ,方向參數(shù)θ與原始卷積權(quán)重w經(jīng)過rotatematrix旋轉(zhuǎn)矩陣映射后,得到旋轉(zhuǎn)后的卷積核參數(shù)w'。f表示上一級輸出的特征圖,avgpool表示平均池化,每個通道都有不同的權(quán)重,將通道權(quán)重和通道注意力圖相乘,形成最終的注意力權(quán)重mh(f)。最終,注意力權(quán)重mh(f)用于調(diào)整不同通道的重要性,conv2d表示標(biāo)準(zhǔn)二維卷積,⊙表示逐元素點乘操作。隨著訓(xùn)練的進行,網(wǎng)絡(luò)逐漸優(yōu)化,使得注意力權(quán)重逐漸集中在目標(biāo)區(qū)域,從而提高檢測精度和魯棒性。
13、進一步地,步驟s2中所述的增強路徑特征金字塔網(wǎng)絡(luò)(epfpn)采用多路徑設(shè)計,利用高層的語義信息與低層的細節(jié)信息進行有效融合,以增強模型對多尺度目標(biāo)的識別能力。同時,網(wǎng)絡(luò)中引入的增強路徑,將原始輸入與輸出融合,可以彌補原始特征在交互過程中的損失,公式化表達如下:
14、pl(top-down)=upsample(pl+1)+cl
15、pl(final)=(pl(top-down)+conv2d(bl))⊕pl
16、其中,在自上而下路徑中,上一層的特征圖pl+1通過上采樣操作被放大至與當(dāng)前層的輸入特征圖cl相同的空間分辨率,得到upsample(pl+1),接著與底層特征cl進行逐像素加和,得到自上而下路徑的聚合特征圖pl(top-down),在自下而上的路徑中,bl表示自下而來的特征圖,經(jīng)過卷積操作conv2d(bl)后生成新的特征,pl(top-down)與卷積后的conv2d(bl)進行加和,得到當(dāng)前層的最終輸出,最終與原始特征進行拼接,以遞歸的方式逐層進行特征聚合。
17、進一步地,步驟s3中所述的特征細化模塊rfca,采用特征重構(gòu)的思想重構(gòu)和細化每一次融合后的整體特征,生成重構(gòu)后的融合特征;輸入特征首先與3x3內(nèi)核進行卷積以拓寬感受野,然后進行批量歸一化bn和silu激活;隨后,輸出特征圖通過協(xié)作卷積與原始輸入合并;最后,經(jīng)過維度調(diào)整后產(chǎn)生新的輸出。
18、經(jīng)過上述步驟,富含高級語義信息的細粒度特征經(jīng)過兩個后續(xù)的卷積層來分別進行回歸和分類。分類頭負責(zé)來預(yù)測每個錨框的類別概率分布,從而確定物體的類別?;貧w頭同樣通過卷積層來預(yù)測每個區(qū)域或錨框的邊界框參數(shù),實現(xiàn)目標(biāo)位置的回歸。通過非極大值抑制去除冗余框之后,得到最終的目標(biāo)檢測結(jié)果。
19、相比于以往的遙感目標(biāo)檢測方法,本發(fā)明的創(chuàng)新點在于提出了一種有效提取旋轉(zhuǎn)物體特征并減少特征損失的遙感物體檢測網(wǎng)絡(luò),本發(fā)明將可變形卷積和旋轉(zhuǎn)卷積相結(jié)合,并由此構(gòu)建了針對遙感圖像中目標(biāo)的特征提取主干,采用串行的方式動態(tài)的提取遙感目標(biāo)的特征,從而自適應(yīng)遙感物體的特點,以達到充分提取遙感目標(biāo)細粒度特征的目的。具體來說,在這個串行的特征提取網(wǎng)絡(luò)結(jié)構(gòu)中,構(gòu)建的姿態(tài)引導(dǎo)特征獲取模塊(tp-gfa)貫穿整個特征提取流程,特征串行的通過姿態(tài)引導(dǎo)的特征提取模塊,特征在這個過程中被逐步編碼,對遙感物體的特征表示逐漸充分和豐富,理想條件下隨著層數(shù)的加深,經(jīng)過更多的姿態(tài)引導(dǎo)特征獲取模塊會獲取更全面的細粒度信息。采用上述方法能使得模型在面對方向任意的遙感目標(biāo)時能表現(xiàn)出良好的檢測表現(xiàn),能更好的適應(yīng)復(fù)雜的現(xiàn)實環(huán)境。
20、本發(fā)明的有益效果是:
21、本發(fā)明提出的基于遙感圖像的旋轉(zhuǎn)目標(biāo)檢測方法能夠在遙感場景中實現(xiàn)對目標(biāo)的精確檢測。所提出的姿態(tài)引導(dǎo)特征獲取模塊能夠適應(yīng)遙感場景下的目標(biāo)特點,從而穩(wěn)定且準(zhǔn)確的獲取多類遙感物體的細粒度特征。與此同時,增強路徑特征金字網(wǎng)絡(luò)能夠有效彌補特征交互過程中的信息損失和退化,從而進一步提升檢測準(zhǔn)確性。最后,特征細化模塊可以兼顧到類間差異性和類內(nèi)相似性,生成高質(zhì)量的聚合特征,確保了方法在多目標(biāo)場景中的穩(wěn)定性和魯棒性。