最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法

文檔序號:41944463發(fā)布日期:2025-05-16 14:01閱讀:3來源:國知局
一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法

本發(fā)明涉及目標(biāo)檢測,具體為一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法。


背景技術(shù):

1、霧霾作為一種嚴(yán)重的環(huán)境污染問題,通常發(fā)生在空氣質(zhì)量惡劣、能見度較低的城市或工業(yè)化地區(qū)。其高污染濃度和長期影響不僅危害人體健康,還對交通安全、環(huán)境監(jiān)測等領(lǐng)域帶來了極大挑戰(zhàn)。特別是在交通監(jiān)控、公共安全和環(huán)境管理等領(lǐng)域,霧霾場景下的小目標(biāo)(如行人、車輛、關(guān)鍵設(shè)備等)的檢測成為保障安全和提高管理效率的關(guān)鍵。然而,由于霧霾的遮擋作用,傳統(tǒng)的目標(biāo)檢測方法在低能見度條件下對圖像中的小目標(biāo)檢測表現(xiàn)出明顯的不足,亟需新的技術(shù)手段來提升霧霾場景下小目標(biāo)檢測的準(zhǔn)確性與魯棒性。

2、在霧霾場景下,目標(biāo)檢測面臨多重挑戰(zhàn):一方面,霧霾導(dǎo)致目標(biāo)圖像的對比度降低、邊緣模糊、細(xì)節(jié)丟失,使得傳統(tǒng)的基于特征工程的方法(如基于邊緣檢測、顏色分割等技術(shù))難以有效提取目標(biāo)信息;另一方面,小目標(biāo)在霧霾環(huán)境中由于尺寸較小,且與背景信息的融合程度較高,更易被傳統(tǒng)檢測方法忽略,導(dǎo)致漏檢率顯著增加。此外,霧霾場景下復(fù)雜的環(huán)境光照變化、光學(xué)散射效應(yīng)等問題進(jìn)一步加劇了目標(biāo)檢測的難度。

3、傳統(tǒng)的小目標(biāo)檢測方法,如基于手工設(shè)計特征的圖像處理算法,往往需要大量人工調(diào)試,且在面對復(fù)雜的霧霾場景時難以實現(xiàn)高效、可靠的檢測效果。同時,這些方法通常無法兼顧多尺度目標(biāo)的檢測需求,對于目標(biāo)的形態(tài)多樣性和復(fù)雜背景缺乏適應(yīng)能力。近年來,隨著深度學(xué)習(xí)技術(shù)的迅速發(fā)展,尤其是卷積神經(jīng)網(wǎng)絡(luò)(cnn)等模型在目標(biāo)檢測領(lǐng)域的廣泛應(yīng)用,基于深度學(xué)習(xí)的小目標(biāo)檢測方法展現(xiàn)出了顯著的性能優(yōu)勢。深度學(xué)習(xí)通過從數(shù)據(jù)中自動提取多層次的特征,可以更好地捕捉目標(biāo)的紋理信息和空間分布特征,為霧霾場景下的小目標(biāo)檢測提供了全新的解決方案。

4、盡管深度學(xué)習(xí)技術(shù)在目標(biāo)檢測中取得了顯著進(jìn)展,霧霾場景下的小目標(biāo)檢測仍然面臨諸多技術(shù)瓶頸。例如,由于霧霾導(dǎo)致的圖像質(zhì)量退化,現(xiàn)有深度學(xué)習(xí)模型在特征提取時可能難以區(qū)分目標(biāo)與背景,從而導(dǎo)致誤檢和漏檢問題。此外,小目標(biāo)往往在圖像中所占的大小比例較低,現(xiàn)有方法往往會因為下采樣操作丟失關(guān)鍵信息,影響檢測精度。因此,如何在霧霾場景下設(shè)計更加適應(yīng)低質(zhì)量圖像的深度學(xué)習(xí)模型,特別是增強其對小目標(biāo)特征的提取能力,是當(dāng)前研究的重要方向。

5、基于上述,現(xiàn)有的基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測模型,存在以下問題:

6、1.霧霾場景對圖像的干擾導(dǎo)致檢測性能下降:現(xiàn)有目標(biāo)檢測方法在霧霾場景下表現(xiàn)不佳,主要是由于霧霾導(dǎo)致圖像對比度降低、細(xì)節(jié)模糊和目標(biāo)特征丟失。這種情況下,傳統(tǒng)模型難以提取可靠的目標(biāo)特征,尤其對于小目標(biāo)而言,容易出現(xiàn)漏檢或誤檢現(xiàn)象。

7、2.小目標(biāo)與復(fù)雜背景交織導(dǎo)致特征表達(dá)能力不足:小目標(biāo)通常與復(fù)雜背景交織在一起,使得現(xiàn)有目標(biāo)檢測模型難以區(qū)分目標(biāo)與背景。尤其是在復(fù)雜場景下,小目標(biāo)的特征容易被背景噪聲掩蓋,導(dǎo)致誤檢率和漏檢率較高?,F(xiàn)有方法對小目標(biāo)特征的表達(dá)能力不強,無法充分提取小目標(biāo)的細(xì)節(jié)和邊界信息。缺乏有效的特征增強機制,特征提取過程中目標(biāo)特征易被背景信息淹沒。對小目標(biāo)的檢測準(zhǔn)確性和可靠性不足,特別是在微小目標(biāo)或復(fù)雜場景下表現(xiàn)較差。

8、3.多尺度特征整合不足導(dǎo)致模型識別能力有限:小目標(biāo)檢測需要融合多層次、多尺度的特征信息,但現(xiàn)有模型在特征整合方面存在不足,難以捕捉不同層級特征之間的關(guān)聯(lián)性,尤其是對微小和細(xì)長小目標(biāo)的檢測效果不佳。

9、4.傳統(tǒng)方法對多尺度和多層次特征的處理能力不足:傳統(tǒng)目標(biāo)檢測方法使用固定的卷積結(jié)構(gòu)或簡單的特征融合技術(shù),難以適應(yīng)小目標(biāo)在不同尺度上的特性變化,導(dǎo)致對多尺度目標(biāo)的檢測效果不理想。

10、因此,發(fā)明一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法。


技術(shù)實現(xiàn)思路

1、為解決上述技術(shù)問題,根據(jù)本發(fā)明的一個方面,本發(fā)明提供了如下技術(shù)方案:

2、一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法,其包括具體步驟如下:

3、s1:構(gòu)建霧霾場景下小目標(biāo)檢測原始數(shù)據(jù)集,或使用現(xiàn)有公開的霧霾場景下小目標(biāo)檢測數(shù)據(jù)集;先采集霧霾環(huán)境下的小目標(biāo)圖像數(shù)據(jù),接著使用標(biāo)注工具對小目標(biāo)的位置進(jìn)行框選,并進(jìn)行標(biāo)簽標(biāo)注;

4、s2:對霧霾場景下小目標(biāo)檢測原始數(shù)據(jù)集進(jìn)行預(yù)處理,得到預(yù)處理后的霧霾場景下小目標(biāo)數(shù)據(jù)集,并對數(shù)據(jù)集進(jìn)行劃分,以便后續(xù)對基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測模型進(jìn)行訓(xùn)練;

5、s3:構(gòu)建霧霾場景下小目標(biāo)檢測網(wǎng)絡(luò)fasod-net;

6、s4:在構(gòu)建的霧霾場景小目標(biāo)檢測網(wǎng)絡(luò)fasod-net模型基礎(chǔ)上,訓(xùn)練并更新各層的參數(shù);首先初始化所有神經(jīng)網(wǎng)絡(luò)參數(shù),設(shè)置模型相關(guān)的超參數(shù),包括訓(xùn)練輪次、批處理大小、權(quán)重衰減系數(shù)、學(xué)習(xí)率以及總迭代次數(shù);

7、s5:霧霾場景小目標(biāo)檢測模型訓(xùn)練完后,應(yīng)用訓(xùn)練好的霧霾場景小目標(biāo)檢測模型對霧霾場景圖像進(jìn)行小目標(biāo)檢測;最終輸出霧霾場景下的小目標(biāo)檢測結(jié)果,包括小目標(biāo)邊界框坐標(biāo)、小目標(biāo)類別標(biāo)簽和置信度分?jǐn)?shù)。

8、作為本發(fā)明所述的一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法的一種優(yōu)選方案,其中:所述s2的具體步驟如下:

9、s21:對霧霾場景下小目標(biāo)檢測原始數(shù)據(jù)集中的霧霾場景圖像進(jìn)行裁剪至統(tǒng)一大小,由于原始數(shù)據(jù)集較少,為了確保數(shù)據(jù)集具有足夠的樣本用于訓(xùn)練、驗證和測試,并增強霧霾場景下小目標(biāo)檢測模型的魯棒性,降低模型對圖像質(zhì)量的敏感度;

10、s22:接著進(jìn)行數(shù)據(jù)增強處理,從而更好地訓(xùn)練深度學(xué)習(xí)模型,最終得到數(shù)據(jù)增強后的霧霾場景下小目標(biāo)數(shù)據(jù)集,并按照8:1:1的比例劃分為訓(xùn)練集、驗證集和測試集。

11、作為本發(fā)明所述的一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法的一種優(yōu)選方案,其中:所述s3的具體步驟如下:

12、s31:將霧霾場景圖像輸入至去霧與淺層特征提取模塊中;

13、s32:將f4輸入至精細(xì)特征捕捉多通道卷積模塊中;

14、s33:將f2、f3、f5輸入至多尺度特征整合增強檢測模塊中。

15、作為本發(fā)明所述的一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法的一種優(yōu)選方案,其中:所述s31中去霧與淺層特征提取模塊的構(gòu)建與執(zhí)行過程為:

16、s311:對輸入的霧霾場景圖像應(yīng)用包含3×3卷積、歸一化和激活函數(shù)的cbs操作,得到霧霾淺層特征圖f1;

17、s312:將f1輸入至多尺度融合大卷積核增強模塊mse-lkc;

18、s313:將f2輸入至并行增強注意力模塊pea中;

19、s314:將f3與f1輸入到fusion中進(jìn)行通道維度融合,通過融合不同層次的特征得到最終輸出的特征圖f4。

20、作為本發(fā)明所述的一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法的一種優(yōu)選方案,其中:所述s312中mse-lkc模塊的運行和構(gòu)建過程為:

21、s3121:對輸入f1進(jìn)行批歸一化處理得到特征圖f1_1,隨后使用大小為7×7的卷積核對f1_1進(jìn)行卷積操作提取特征得到特征圖f1_2,再使用大小為5×5的卷積核對f1_2進(jìn)行卷積操作得到第一階段的特征圖f1_3;

22、s3122:將f1_3分別輸入至擴張率大小為7×7的深度擴張卷積模塊、擴張率大小為13×13的深度擴張卷積模塊、擴張率大小為19×19的深度擴張卷積模塊進(jìn)行提取多尺度特征,分別生成對應(yīng)的三個特征子圖f1_4、f1_5和f1_6;隨后,通過c操作將f1_4、f1_5和f1_6在通道維度上進(jìn)行拼接,得到融合后的特征圖f1_7;

23、s3123:將f1_7輸入到一個大小為1×1的卷積核中進(jìn)行卷積操作得到特征圖f1_8,將f1_8經(jīng)過gelu激活函數(shù)處理后得到特征圖f1_9,對f1_9進(jìn)行conv1×1卷積操作得到最終輸出特征圖f1_10;

24、s3124:通過殘差連接將f1與f1_10相加,形成具有更強表征能力的特征圖f2。

25、作為本發(fā)明所述的一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法的一種優(yōu)選方案,其中:所述s313中pea模塊的構(gòu)建與執(zhí)行過程為:

26、s3131:對f2進(jìn)行批歸一化,以標(biāo)準(zhǔn)化特征分布,提高模型的穩(wěn)定性和收斂速度,得到歸一化后的特征圖f2_1;

27、s3132:將f2_1分別輸入三個注意力模塊:

28、s31321:像素級注意力模塊對f2_1的空間維度進(jìn)行處理,提取局部顯著性信息,得到增強后的特征子圖f2_2;

29、s31322:通道級注意力模塊對f2_1的通道維度進(jìn)行操作,捕捉全局上下文信息,得到權(quán)重調(diào)整后的特征子圖f2_3;

30、s31323:簡單像素級注意力模塊采用簡化機制對f2_1進(jìn)行處理,補充其他模塊的特征提取能力,得到特征子圖f2_4;

31、s3133:將f2_2、f2_3和f2_4在通道維度上進(jìn)行拼接,得到融合后的特征圖f2_5;

32、s3134:對f2_5進(jìn)行conv1×1卷積操作,實現(xiàn)特征降維,并通過gelu激活函數(shù)對特征圖進(jìn)行非線性變換,得到處理后的特征圖f2_6;再對f2_6進(jìn)行conv1×1卷積操作,進(jìn)一步提取特征并適應(yīng)后續(xù)任務(wù),得到特征圖f2_7;

33、s3135:通過殘差連接將f2與f2_7相加,得到最終輸出特征圖f3;

34、其中,應(yīng)用pea對f2進(jìn)行處理,得到f3的過程如下式所示:

35、f2_1=batchnorm(f2)

36、f3=f2+conv1_1(gelu(conv1_1(c(pa(f2_1),ca(f2_1),spa(f2_1)))))

37、其中,batchnorm表示批歸一化操作;conv1_1表示大小為1×1的卷積操作;gelu表示應(yīng)用激活函數(shù)gelu;spa表示簡單像素級注意力模塊;ca表示通道級注意力模塊;pa表示像素級注意力模塊;c表示在通道維度上進(jìn)行拼接操作;+表示殘差連接操作。

38、作為本發(fā)明所述的一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法的一種優(yōu)選方案,其中:所述s31321中像素級注意力模塊的構(gòu)建與執(zhí)行過程為:

39、s313211:對f2_1進(jìn)行conv1×1卷積操作,用于調(diào)整輸入特征圖的通道數(shù);接著,應(yīng)用激活函數(shù)gelu進(jìn)一步處理f2_1,得到經(jīng)過激活后的特征圖f2_1_1;

40、s313212:對f2_1_1進(jìn)行conv1×1卷積操作,得到中間特征圖f2_1_2;接著,應(yīng)用sigmoid激活函數(shù)對f2_1_2進(jìn)行歸一化處理,得到像素級的注意力權(quán)重;

41、s313213:將f2_1和像素注意力權(quán)重進(jìn)行逐元素相乘操作,對特征圖進(jìn)行加權(quán),得到最終的特征圖f2_2;其模塊能夠加強小目標(biāo)特征的表達(dá),同時抑制不相關(guān)的背景信息,提高模型在霧霾場景中的小目標(biāo)檢測能力;

42、其中,應(yīng)用像素級注意力模塊對f2_1進(jìn)行處理,得到f2_2的過程如下式所示:

43、f2_2=f2_1×s(conv1_1(gelu(conv1_1(f2_1))))

44、其中,conv1_1表示大小為1×1的卷積操作;gelu表示應(yīng)用激活函數(shù)gelu;s表示sigmoid激活函數(shù);×表示進(jìn)行逐元素相乘操作;

45、所述s31322中通道級注意力模塊的構(gòu)建與執(zhí)行過程為:

46、s313221:對f2_1進(jìn)行全局平均池化,生成通道維度上的全局信息;然后,對池化結(jié)果進(jìn)行conv1×1卷積操作得到特征圖t1,將t1通過激活函數(shù)gelu進(jìn)行非線性處理,生成中間表達(dá)特征圖t2;

47、s313222:再對t2進(jìn)行conv1×1卷積操作后通過sigmoid激活函數(shù)生成通道注意力權(quán)重;將f2_1和通道注意力權(quán)重進(jìn)行逐元素相乘操作,實現(xiàn)通道上的加權(quán)輸出,得到增強的輸出特征圖f2_3;

48、其中,應(yīng)用通道級注意力模塊對f2_1進(jìn)行處理,得到f2_3的過程如下式所示:

49、f2_3=f2_1×s(conv1_1(gelu(conv1_1(gap(f2_1)))))

50、其中,gap表示全局平均池化操作;conv1_1表示大小為1×1的卷積操作;gelu表示應(yīng)用激活函數(shù)gelu;s表示sigmoid激活函數(shù);×表示進(jìn)行逐元素相乘操作;

51、所述s31323中簡單像素級注意力模塊的構(gòu)建與執(zhí)行過程為:

52、s313231:對f2_1進(jìn)行conv1×1卷積操作,得到初步的像素特征圖x1;隨后,其x1經(jīng)過另一個大小為3×3的卷積核進(jìn)行卷積操作,以進(jìn)一步提取局部像素相關(guān)性信息,得到特征圖x2;

53、s313232:將f2_1通過另一條分支直接進(jìn)行conv1×1卷積操作,得到特征圖x3;接著,將x2、x3相加后通過sigmoid激活函數(shù)生成像素注意力權(quán)重;

54、s313233:將f2_1和像素注意力權(quán)重進(jìn)行逐元素相乘操作,得到增強的輸出特征圖f2_4;

55、其中,應(yīng)用簡單像素級注意力模塊對f2_1進(jìn)行處理,得到f2_4的過程如下式所示:

56、f2_4=f2_1×s(conv3_3(conv1_1(f2_1))+conv1_1(f2_1))

57、其中,conv1_1表示大小為1×1的卷積操作;conv3_3表示大小為3×3的卷積操作;s表示sigmoid激活函數(shù);+表示將兩條分支的結(jié)果相加操作;×表示進(jìn)行逐元素相乘操作。

58、作為本發(fā)明所述的一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法的一種優(yōu)選方案,其中:所述s32中精細(xì)特征捕捉多通道卷積模塊的構(gòu)建與執(zhí)行過程為:

59、s321:對f4進(jìn)行conv1×1卷積操作,用于調(diào)整通道數(shù)并提取初步特征,生成特征圖f4_1;

60、s322:對f4_1進(jìn)行特征分流,分為三條特征處理路徑:在第一條路徑中,首先經(jīng)過2個conv?3×3卷積操作,提取局部深層特征,生成特征圖f4_2;在第二條路徑中,依次通過conv3×3卷積操作和conv5×5卷積操作,進(jìn)一步提取更大感受野的特征,生成特征圖f4_3;在第三條路徑中,經(jīng)過conv5×5卷積操作,進(jìn)一步提取更大感受野的特征,生成特征圖f4_4;

61、s323:將三條路徑輸出的f4_2、f4_3和f4_4在通道維度上進(jìn)行拼接,得到融合后的特征圖f4_5;通過conv1×1卷積操作對f4_5進(jìn)行通道整合,生成最終的小目標(biāo)深層特征圖f4_6;

62、s324:再對f4_6進(jìn)行conv3×3卷積操作,進(jìn)一步整合跨路徑的信息,并優(yōu)化局部特征表達(dá),生成特征圖f5;通過上述步驟,其模塊結(jié)合多尺度卷積核和分流結(jié)構(gòu),能夠有效提取小目標(biāo)的深層語義特征,同時增強模型對小目標(biāo)的檢測能力。

63、作為本發(fā)明所述的一種基于深度學(xué)習(xí)的霧霾場景下小目標(biāo)檢測方法的一種優(yōu)選方案,其中:所述s33中多尺度特征整合增強檢測模塊的構(gòu)建與執(zhí)行過程為:

64、s331:將輸入的f2通過可變形卷積操作,以動態(tài)適應(yīng)霧霾場景中小目標(biāo)的形態(tài)特征和復(fù)雜背景噪聲,生成增強后的特征圖f6;將輸入的f3通過可變形卷積操作,生成增強后的特征圖f7;

65、s332:將f5與f7在通道維度上進(jìn)行拼接,形成融合特征圖f8,增強了特征的多尺度表達(dá)能力,并兼顧了細(xì)節(jié)和全局特征的統(tǒng)一;隨后,對f8進(jìn)行conv?3×3卷積操作,以進(jìn)一步整合跨路徑的信息,并優(yōu)化特征的多層次表達(dá),生成優(yōu)化特征圖f9;再將f9與f6在通道維度上進(jìn)行拼接,形成融合特征圖f10;

66、s333:對f10進(jìn)行一次conv3×3操作,以進(jìn)一步整合跨路徑的信息,并優(yōu)化特征的多層次表達(dá),得到特征圖f11;將f11輸入目標(biāo)檢測頭head中,運用head對f11進(jìn)行檢測,輸出包含檢測信息的張量,每一行對應(yīng)一個檢測結(jié)果,所述檢測結(jié)果是對霧霾場景下的小目標(biāo)檢測結(jié)果,分別包括邊界框坐標(biāo)、小目標(biāo)類別標(biāo)簽和置信度分?jǐn)?shù)。

67、與現(xiàn)有技術(shù)相比:

68、本發(fā)明在處理霧霾場景下的小目標(biāo)檢測任務(wù)時,能夠更準(zhǔn)確地捕捉和識別小目標(biāo)的細(xì)節(jié)特征,有效地減少了霧霾對小目標(biāo)特征的干擾,解決了現(xiàn)有技術(shù)中因霧霾造成的對小目標(biāo)特征表達(dá)不清晰的問題;本發(fā)明通過多尺度特征提取和多層次特征融合,能夠更準(zhǔn)確地區(qū)分小目標(biāo)與背景,解決了小目標(biāo)在復(fù)雜霧霾場景中容易與背景信息混淆的難題;此外,本發(fā)明增強了對微小、細(xì)長小目標(biāo)的檢測能力,顯著減少了因現(xiàn)有技術(shù)中過多的池化和卷積操作導(dǎo)致的小目標(biāo)特征丟失問題,使得在霧霾場景下的小目標(biāo)檢測精度和魯棒性得到了顯著提升。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1