最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于DeepLabV3+與ViT的遙感影像精細土地利用分類方法

文檔序號:41946138發(fā)布日期:2025-05-16 14:03閱讀:3來源:國知局
一種基于DeepLabV3+與ViT的遙感影像精細土地利用分類方法

本發(fā)明涉及遙感圖像處理,具體地,涉及一種基于deeplabv3+與vit的遙感影像精細土地利用分類方法。


背景技術(shù):

1、我國明確提出,要構(gòu)建高質(zhì)量發(fā)展的國土空間開發(fā)保護新格局,而精準獲取土地利用情況是實現(xiàn)這一目標的關(guān)鍵基礎(chǔ)。土地利用信息在城鄉(xiāng)規(guī)劃、生態(tài)環(huán)境監(jiān)測、農(nóng)作物災情評估、災害風險評估等領(lǐng)域發(fā)揮著重要作用,是合理規(guī)劃國土資源的首要任務(wù)。遙感衛(wèi)星影像以其覆蓋范圍廣、更新周期短、數(shù)據(jù)獲取成本低等優(yōu)勢,為土地利用研究提供了強有力的數(shù)據(jù)支撐。然而,傳統(tǒng)的人工標注遙感影像方法存在效率低、成本高、精度受主觀因素影響等問題,難以滿足大規(guī)模、高精度的土地利用分類需求。

2、隨著計算機技術(shù)的發(fā)展,土地利用分類方法經(jīng)歷了從傳統(tǒng)人工目視解譯到基于統(tǒng)計模式的監(jiān)督與非監(jiān)督分類,再到當前以機器學習和深度學習為主導的智能化分類技術(shù)的演變。早期的土地利用分類主要依賴高分辨率遙感數(shù)據(jù)和人工目視解譯,雖然在一定程度上降低了成本,但準確性和時效性難以滿足現(xiàn)代國土資源管理的需求。隨后,基于統(tǒng)計模式的分類方法逐漸興起,其中監(jiān)督分類方法(如最小距離法、極大似然法)需要依賴先驗知識和訓練樣本,而非監(jiān)督分類方法(如k-means聚類、isodata算法)則通過自動聚類分析減少人工干預。然而,這些方法在處理復雜地物類型和非線性數(shù)據(jù)時表現(xiàn)有限,難以適應高精度分類的需求。

3、近年來,機器學習技術(shù)的引入為土地利用分類帶來了顯著提升。支持向量機(svm)因其在處理小樣本、高維度數(shù)據(jù)時的優(yōu)異性能而被廣泛應用;決策樹和隨機森林算法則以其高效處理大規(guī)模數(shù)據(jù)的能力受到青睞。特別是隨機森林算法,通過集成學習策略顯著提高了分類的魯棒性和準確性。與此同時,人工神經(jīng)網(wǎng)絡(luò)尤其是卷積神經(jīng)網(wǎng)絡(luò)(cnn)的興起,為土地利用分類帶來了革命性突破。以u-net、deeplabv3+為代表的深度學習模型,在語義分割任務(wù)中實現(xiàn)了像素級的精確分類,顯著提升了復雜場景下的分類精度。

4、此外,transformer網(wǎng)絡(luò)作為一種新興技術(shù),在自然語言處理領(lǐng)域取得巨大成功后,也逐漸被引入計算機視覺領(lǐng)域。其基于自注意力機制的架構(gòu)能夠有效捕捉遙感影像中的長距離依賴關(guān)系,尤其在處理大范圍、多尺度地物分類任務(wù)時表現(xiàn)出色。例如,視覺transformer(vit)和swin?transformer等模型在遙感圖像分類中展現(xiàn)了強大的性能,為土地利用分類提供了新的技術(shù)路徑。

5、盡管當前技術(shù)取得了顯著進展,但土地利用分類仍面臨一些挑戰(zhàn)。首先,基于語義分割的遙感影像分類模型在不同地區(qū)數(shù)據(jù)上的遷移性較差,難以直接應用于跨區(qū)域場景。其次,多類別精細化分類的需求日益增長,但現(xiàn)有模型在處理復雜地物類型時仍存在精度不足的問題。因此,亟需一種能夠結(jié)合卷積神經(jīng)網(wǎng)絡(luò)局部特征提取能力和transformer全局上下文建模能力的新型方法,以提升土地利用分類的精度和泛化能力。

6、而申請?zhí)枮?02210617050.9的中國發(fā)明專利公開了《一種土地利用分類方法及系統(tǒng)》,所述方法包括:訓練好的土地利用分類模型對輸入的目標土地影像中各像素進行土地利用類型分類,得到第一土地分類圖像;土地利用分類模型包括編碼器、雙路注意力模塊、空間金字塔池化模塊和解碼器;雙路注意力模塊包括第一通道注意力模塊和第一空間位置注意力模塊;通過雙路注意力模塊得到通道注意力加權(quán)特征和空間注意力加權(quán)特征;空間金字塔池化模塊再對兩者進行融合得到融合特征;條件隨機場對第一土地分類圖像中各像素進行土地利用類型分類,得到第二土地分類圖像。


技術(shù)實現(xiàn)思路

1、為解決現(xiàn)有技術(shù)土地利用分類存在精度以及泛化能力不足的技術(shù)問題,本發(fā)明提供了一種基于deeplabv3+與vit的遙感影像精細土地利用分類方法,本發(fā)明采用的技術(shù)方案是:

2、本發(fā)明第一方面提供了一種基于deeplabv3+與vit的遙感影像精細土地利用分類方法,所述方法包括:

3、構(gòu)建基于deeplabv3+與vit的土地利用分類模型;

4、對公開的高分辨率遙感影像土地覆蓋分類數(shù)據(jù)集進行預處理,得到模型數(shù)據(jù)集;

5、通過所述模型數(shù)據(jù)集對所述基于deeplabv3+與vit的土地利用分類模型進行訓練以及性能評估,得到最終模型;

6、獲取高分一號遙感影像作為待分類目標數(shù)據(jù),并對目標數(shù)據(jù)進行預處理,得到目標數(shù)據(jù)集;

7、將所述目標數(shù)據(jù)集輸入到所述最終模型進行像素級的分類預測,得到高精度的分類結(jié)果。

8、作為一種優(yōu)選方案,構(gòu)建基于deeplabv3+與vit的土地利用分類模型的方法包括:

9、構(gòu)建deeplabv3+模型框架:

10、deeplabv3+模型框架采用編碼器-解碼器結(jié)構(gòu),編碼器由主干網(wǎng)絡(luò)resnet-101和空洞空間卷積池化金字塔池化模塊aspp組成,resnet-101主要結(jié)構(gòu)為:首先一個7×7步長為2的卷積,接著為3×3步長為2的最大池化,之后為bottleneck結(jié)構(gòu),其中bottleneck結(jié)構(gòu)是由一個1×1卷積,一個3×3卷積和一個1×1卷積組成的殘差結(jié)構(gòu);aspp主要結(jié)構(gòu)為:將主干網(wǎng)絡(luò)輸出的特征圖,分別輸入到一個1×1卷積、膨脹率為6、12、18的空洞卷積和一個全局平均池化模塊中,得到五張?zhí)卣鲌D,將其進行拼接,之后經(jīng)過一個1×1卷積;而解碼器則是對主干網(wǎng)絡(luò)中間輸出的低層級特征圖使用1×1卷積進行降維,再對aspp輸出的特征圖進行上采樣,得到兩張?zhí)卣鲌D,將其拼接起來,之后經(jīng)過一個3×3卷積;

11、構(gòu)建vision?transformer模塊:

12、所述vision?transformer模塊包括embedding層、transformer?encoder層以及mlp?head層;采用所述embedding層將輸入圖像處理成transformer能夠接收的token序列;設(shè)置輸入圖像維度為h×w×c,每個塊的大小為p×p,首先將輸入圖像按照塊的大小劃分為一系列二維序列,得到n個塊,即,其中,且n為transformer模塊輸入序列的有效長度,接著通過線性變換將每個塊分別映射為一維向量,之后將每個一維向量與相應的位置編碼進行拼接,組成圖像token,并在最前端添加一個類別編碼,這個類別token用于最后的類別輸出,最終得到傳入transformer?encoder層的輸入,表達式為:

13、(1)

14、其中,為塊的編碼添加的參數(shù);為位置編碼添加的參數(shù),為類別編碼;

15、所述transformer?encoder層由l個transformer?encoder模塊堆疊而成,每個transformer?encoder模塊的結(jié)構(gòu)主要由多頭自注意力機制和多層感知機制組成,在所述多頭自注意力機制和所述多層感知機制之前設(shè)置歸一化模塊,并利用殘差結(jié)構(gòu),將輸入特征和輸出特征進行融合,運算表達式為:

16、(2)

17、(3)

18、其中,mlp模塊由全連接、gelu激活函數(shù)以及dropout構(gòu)成。

19、采用所述mlp?head層對圖像進行分類,并最終輸出分類的結(jié)果,所述mlp?head層由layer?norm模塊和線性映射模塊構(gòu)成,表達式為:

20、(4)

21、在deeplabv3+模型框架,引入vision?transformer模塊,得到基于deeplabv3+與vit的土地利用分類模型:

22、所述基于deeplabv3+與vit的土地利用分類模型采用編碼器-解碼器結(jié)構(gòu),編碼器由主干網(wǎng)絡(luò)resnet-101、aspp以及vision?transformer組成;將遙感圖像輸入主干網(wǎng)絡(luò)resnet-101,經(jīng)過深度卷積操作后得到高層級特征圖,分別輸入到aspp模塊和visiontransformer模塊中,aspp模塊將得到的高層級特征圖分別輸入到一個1×1卷積、膨脹率為6、12、18的空洞卷積和一個全局平均池化模塊中,得到5種特征圖像,將其進行拼接,得到了融合多尺度信息的高層級特征圖;vision?transformer模塊則將得到的高層級特征圖經(jīng)過patch?embedding層處理后輸入到transformer層,該層由12個transformer模塊組成,將得到的全局高層級特征圖像經(jīng)過patch?expanding層處理后恢復到輸入模塊前的尺寸大??;解碼器則是將主干網(wǎng)絡(luò)中間輸出的低層級特征圖輸入到1×1卷積中得到高層級特征圖,將經(jīng)過aspp模塊得到的融合多尺度信息的高層級特征圖輸入到1×1卷積并進行4倍上采樣后得到的多尺度低層級特征圖,以及將經(jīng)過vision?transformer模塊得到的提取全局特征的高層級特征圖輸入到1×1卷積并進行4倍上采樣后得到的全局低層級特征圖,將三者進行拼接;最后將拼接后的特征圖輸入到3×3卷積并進行4倍上采樣后,得到與原始圖像大小一致的預測圖像。

23、作為一種優(yōu)選方案,對公開的高分辨率遙感影像土地覆蓋分類數(shù)據(jù)集進行預處理,得到模型數(shù)據(jù)集的方法包括:

24、對公開的高分辨率遙感影像土地覆蓋分類數(shù)據(jù)集的圖像裁剪為256*256大小的圖像,使其能夠輸入模型進行訓練;

25、通過數(shù)據(jù)增強對公開的高分辨率遙感影像土地覆蓋分類數(shù)據(jù)集中樣本較少的土地利用類型的圖像進行擴充,得到增強數(shù)據(jù)集;

26、將所述增強數(shù)據(jù)集劃分為源域數(shù)據(jù)集和目標域數(shù)據(jù)集,再依照預設(shè)比例劃分目標域數(shù)據(jù)集為目標域訓練集、目標域驗證集和目標域測試集。

27、作為一種優(yōu)選方案,通過所述模型數(shù)據(jù)集對所述基于deeplabv3+與vit的土地利用分類模型進行訓練以及性能評估,得到最終模型的方法包括:

28、將所述源域數(shù)據(jù)集輸入到所述基于deeplabv3+與vit的土地利用分類模型進行訓練,得到預訓練模型;

29、將目標域訓練集輸入到所述預訓練模型進行微調(diào),得到微調(diào)模型;

30、將目標域驗證集輸入到所述微調(diào)模型進行損失函數(shù)優(yōu)化和超參數(shù)調(diào)整,得到改進模型;

31、將目標域測試集輸入到所述改進模型并根據(jù)預設(shè)的評估指標進行模型性能評估,保留性能最佳的模型作為最終模型。

32、作為一種優(yōu)選方案,所述預設(shè)的評估指標包括:

33、交并比、平均交并比、總體像素精度、kappa系數(shù)及執(zhí)行時間。

34、作為一種優(yōu)選方案,獲取高分一號遙感影像作為待分類目標數(shù)據(jù),并對目標數(shù)據(jù)進行預處理,得到目標數(shù)據(jù)集的方法包括:

35、采用交疊滑窗及膨脹預測的方式對影像進行裁剪,得到目標數(shù)據(jù)集,具體為:

36、對原始遙感影像的右邊界和下邊界用0進行填充,得到第一預處理圖像,其中填充后的圖像大小須為滑動預測窗口的整數(shù)倍;

37、為對邊緣數(shù)據(jù)進行膨脹預測,并對所述填充圖像添加外邊框,得到第二預處理圖像,其中外邊框用0進行填充,填充大小為滑動窗口步長的1/2;

38、采用大小為256×256的滑動窗口,滑動步長為128,對所述第二預處理圖像進行裁剪,并記錄裁剪后的圖像坐標,得到目標數(shù)據(jù)集。

39、作為一種優(yōu)選方案,將所述目標數(shù)據(jù)集輸入到所述最終模型進行像素級的分類預測,得到高精度的分類結(jié)果的方法包括:

40、將目標數(shù)據(jù)集輸入到最終模型中,進行像素級的分類預測,輸出高精度的分類結(jié)果;采用人工目視方式,對每景數(shù)據(jù)進行質(zhì)量檢查,并對分類結(jié)果進行拼接處理,最后進行可視化展示。

41、作為一種優(yōu)選方案,所述拼接處理的方法包括:

42、保留分類結(jié)果圖中尺寸大小為128×128像素的中心區(qū)域;

43、根據(jù)所述裁剪后的圖像坐標,將結(jié)果圖拼接到相應的位置,得到最終的預測結(jié)果圖。

44、本發(fā)明第二方面提供了一種計算機可讀存儲介質(zhì),其上儲存有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)前述的一種基于deeplabv3+與vit的遙感影像精細土地利用分類方法的步驟。

45、本發(fā)明第三方面提供了一種計算機設(shè)備,包括存儲介質(zhì)、處理器以及儲存在所述存儲介質(zhì)中并可被所述處理器執(zhí)行的計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)前述的一種基于deeplabv3+與vit的遙感影像精細土地利用分類方法的步驟。

46、相較于現(xiàn)有技術(shù),本發(fā)明具有的有益效果是:

47、本發(fā)明的基于deeplabv3+與vision?transformer(vit)融合的遙感影像精細土地利用分類方法。創(chuàng)新性地結(jié)合了深度卷積神經(jīng)網(wǎng)絡(luò)(dcnn)的局部特征提取能力與視覺transformer(vit)的全局特征建模優(yōu)勢。通過在卷積神經(jīng)網(wǎng)絡(luò)中嵌入vit模塊,有效捕獲了遙感影像的全局上下文信息,解決了傳統(tǒng)dcnn在像素間關(guān)系建模方面的局限性。通過多尺度特征的提取與融合,顯著提升了模型對復雜土地類別的辨識能力,實現(xiàn)像素級的精細土地利用分類。引入遷移學習和領(lǐng)域自適應技術(shù),本發(fā)明方法在不同地區(qū)數(shù)據(jù)上表現(xiàn)出良好的遷移性和適應性,解決了現(xiàn)有模型在跨區(qū)域應用中遷移性差的問題。本發(fā)明方法在保證高精度的同時,具有較高的計算效率,能夠滿足大規(guī)模遙感影像處理的需求,具有廣泛的實際應用價值。

48、第一,本發(fā)明創(chuàng)新性地將深度卷積神經(jīng)網(wǎng)絡(luò)(dcnn)的局部特征提取能力與視覺transformer(vit)的全局特征建模能力相結(jié)合。通過在卷積神經(jīng)網(wǎng)絡(luò)中嵌入vit模塊,有效捕獲了遙感影像的全局上下文信息,解決了傳統(tǒng)dcnn在像素間關(guān)系建模方面的局限性。同時,利用vit模塊對高層次特征進行全局建模,顯著提升了模型對復雜土地類別的辨識能力。

49、第二,本發(fā)明通過多尺度特征提取與融合機制,能夠同時捕捉遙感影像中的局部細節(jié)和全局結(jié)構(gòu)信息,顯著提升了模型對多尺度地物的分類能力。

50、第三,本發(fā)明方法能夠?qū)崿F(xiàn)像素級的精細土地利用分類,在復雜多類別的遙感影像場景下表現(xiàn)良好。例如,能夠識別池塘、湖泊、河流等水體信息,同時在高密度城市區(qū)域、混合植被區(qū)域等復雜場景中實現(xiàn)高精度分類。

51、第四,通過引入遷移學習和微調(diào)技術(shù),本發(fā)明方法在不同地區(qū)數(shù)據(jù)上表現(xiàn)出良好的遷移性和適應性,解決了現(xiàn)有模型在跨區(qū)域應用中遷移性差的問題。

52、第五,本發(fā)明方法在保證高精度的同時,具有較高的計算效率,能夠滿足大規(guī)模遙感影像處理的需求,具有廣泛的實際應用價值。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1