本發(fā)明屬于側(cè)掃聲吶圖像目標(biāo)識別領(lǐng)域,尤其涉及采用深度學(xué)習(xí)算法的側(cè)掃聲圖沉船目標(biāo)識別。
背景技術(shù):
1、側(cè)掃聲吶(side?scan?sonar)作為水下地貌圖像的主要獲取設(shè)備,具有成本低、效率高、成像分辨率高等優(yōu)點。側(cè)掃聲吶根據(jù)海底目標(biāo)反射的回波的強弱、次數(shù)、時間間隔換算到儀器記錄線的長短、灰度變化,多次發(fā)射接收形成側(cè)掃聲吶聲圖。側(cè)掃聲吶成像具有作用距離遠、穿透能力強等優(yōu)點,特別適用于渾水域,因而在水下地質(zhì)地貌勘測、水下丟失物尋找、壩基檢測等領(lǐng)域得到了廣泛應(yīng)用。
2、傳統(tǒng)聲吶圖像目標(biāo)識別過程是先從聲吶圖像中提取感興趣(regions?ofinterest,roi)目標(biāo)切片;接著,對切片內(nèi)目標(biāo)做分割處理,然后,進一步提取分割圖像的特征;最后,利用分類器對提取特征進行分類識別。由于待識別目標(biāo)多為金屬結(jié)構(gòu),會產(chǎn)生較強的后向散射回波,在聲圖中呈現(xiàn)出高亮區(qū)域;同時因目標(biāo)的遮擋無法接收到聲波,在其后面形成陰影區(qū)域。通常聲波照射導(dǎo)致了高亮與陰影共軛產(chǎn)生,且陰影投射的位置與目標(biāo)的高亮及聲吶的高度呈幾何關(guān)系。依據(jù)聲吶采集原理和目標(biāo)的先驗知識,學(xué)者設(shè)計了一系列目標(biāo)判定規(guī)則和模板,實現(xiàn)水下目標(biāo)識別。深度學(xué)習(xí)的發(fā)展給受限于工作人員經(jīng)驗的傳統(tǒng)目標(biāo)識別過程提供工了新的解決方案。從深度學(xué)習(xí)的角度考慮二維聲吶圖像目標(biāo)識別,通??梢苑纸獬蓛蓚€子任務(wù):分類識別和目標(biāo)檢測。分類識別是將roi分配到預(yù)定義的類中;目標(biāo)檢測是將對象的定位、分類和范圍估計整合到一個步驟中。為了提升識別的性能,一些學(xué)者結(jié)合聲圖目標(biāo)的特性,對傳統(tǒng)深度卷積模型進行改進和優(yōu)化。在傳統(tǒng)水下目標(biāo)識別領(lǐng)域,檢測的概念多用于描述圖像中是否存在目標(biāo),常作為分類識別的前置環(huán)節(jié),用于定位目標(biāo)的roi,而深度學(xué)習(xí)的目標(biāo)檢測以包圍框的形式直接輸出物體的位置和類型。
3、傳統(tǒng)的水下目標(biāo)檢測和識別方法,在小樣本或無樣本情況下,為水下目標(biāo)識別提出了解決思路。然而,傳統(tǒng)的機器學(xué)習(xí)方法受限于聲圖數(shù)據(jù)的處理能力,并且需要對聲圖數(shù)據(jù)進行專業(yè)和深入的理解,才能設(shè)計合適的特征表示方法。相對于傳統(tǒng)的機器學(xué)習(xí),深度學(xué)習(xí)不需要手動提取或手工制作特征,通過數(shù)據(jù)驅(qū)動構(gòu)建對水下環(huán)境及水下目標(biāo)的認知,適用于人類對環(huán)境認知較匱乏的水下探測領(lǐng)域。在聲吶圖像水下目標(biāo)識別工作中,研究方法從傳統(tǒng)特征提取向深度學(xué)習(xí)過渡;研究對象從水下小目標(biāo)擴展到多尺度目標(biāo);研究場景從平坦海底向復(fù)雜地貌轉(zhuǎn)變。通過設(shè)計更可靠的水下目標(biāo)特征、生成高質(zhì)量的樣本數(shù)據(jù)以及采用更先進的網(wǎng)絡(luò)結(jié)構(gòu)來改善二維聲吶圖像水下目標(biāo)識別的精度成為側(cè)掃聲吶聲圖目標(biāo)識別的熱點方向。
技術(shù)實現(xiàn)思路
1、本發(fā)明主要針對側(cè)掃聲吶圖像目標(biāo)識別時,主要依賴人員經(jīng)驗,存在受主觀因素影響且效率低下等問題,考慮充分利用現(xiàn)有側(cè)掃聲吶聲圖資料,同時顧及海底背景場及沉船目標(biāo)特性,提出一種基于改進yolov5網(wǎng)絡(luò)模型的側(cè)掃聲吶沉船目標(biāo)識別方法。該改進方法由增加cbam注意力機制(attention?mechanism)和更換主干網(wǎng)絡(luò)為ghostnet網(wǎng)絡(luò)兩部分構(gòu)成,cbam注意力機制用于從空間和通道兩個維度提高模型對目標(biāo)的檢測能力,ghostnet網(wǎng)絡(luò)有效利用冗余特征圖的同時,實現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)的輕量化。
2、為了達到上述目的,本發(fā)明的技術(shù)方案為:
3、一種基于改進yolov5網(wǎng)絡(luò)模型的側(cè)掃聲吶沉船目標(biāo)識別方法,具體包括以下步驟:
4、第一步,數(shù)據(jù)的預(yù)處理及數(shù)據(jù)集劃分
5、數(shù)據(jù)預(yù)處理主要采用數(shù)據(jù)增強方式,包括圖像裁剪(cutout)、圖像加噪、改變圖像亮度、圖像平移、圖像旋轉(zhuǎn)、圖像鏡像。
6、數(shù)據(jù)經(jīng)過預(yù)處理后按照比例將數(shù)據(jù)集隨機分割為訓(xùn)練集、評估集和測試集。
7、第二步,網(wǎng)絡(luò)模型的改進
8、改進方式一、yolov5中的主干網(wǎng)絡(luò)backbone用于對輸入的圖像進行特征提取,將backbone更換為ghostnet網(wǎng)絡(luò),即將原本的卷積過程替換成n個堆疊的ghost?bottleneck層構(gòu)成的ghostnet網(wǎng)絡(luò);ghostnet網(wǎng)絡(luò)的輸入數(shù)據(jù)首先經(jīng)過3×3的卷積層,然后經(jīng)過n個ghost?bottleneck層,之后依次經(jīng)過一個1×1的卷積核、一次全局平均池化、一個1×1的卷積核,最后平鋪通過全連接層輸出。
9、進一步地,在更換后的backbone部分中,輸入層(input)之后包括2個卷積層(cbs)和15個ghost?bottleneck層,整個backbone將在第5、9、16層得到三個接口分別與neck部分相連。
10、改進方式二、在yolov5中的主干網(wǎng)絡(luò)backbone中,通過以下任一一種方法進行改進:
11、(1)將cbam模塊插入backbone中的c3(csp)模塊內(nèi),并在特征融合層(concat)后引入注意力機制,再經(jīng)過卷積層輸出。
12、(2)在backbone的sppf(空間金字塔池化層)前直接插入注意力機制層。
13、網(wǎng)絡(luò)模型的改進為選擇其中一種方式改進或者采用兩種方式改進。
14、第三步,將預(yù)處理好的訓(xùn)練集分別輸入兩種改進后的網(wǎng)絡(luò)模型中進行訓(xùn)練,并利用評估集來取得最好結(jié)果作為訓(xùn)練結(jié)果保留。
15、第四步,網(wǎng)絡(luò)模型預(yù)測
16、將數(shù)據(jù)預(yù)處理后的測試集輸入到訓(xùn)練好的模型中,得到網(wǎng)絡(luò)模型的預(yù)測結(jié)果,根據(jù)多種指標(biāo)對改進網(wǎng)絡(luò)模型的效果進行評估。
17、本發(fā)明的有益效果為:本發(fā)明提供的一種基于改進yolov5網(wǎng)絡(luò)模型的側(cè)掃聲吶沉船目標(biāo)識別方法,融合了卷積神經(jīng)網(wǎng)絡(luò)、ghostnet網(wǎng)絡(luò)以及注意力機制,在有效提提高針對側(cè)掃聲吶圖像中小型沉船目標(biāo)檢測能力的同時,重點復(fù)雜海底背景場對目標(biāo)檢測的影響,有效提升模型抗干擾能力,在進行側(cè)掃聲吶圖像沉船目標(biāo)識別時,可作為快速、精確處理大批量數(shù)據(jù)的手段,具有實際應(yīng)用價值。
1.一種基于改進yolov5網(wǎng)絡(luò)模型的側(cè)掃聲吶沉船目標(biāo)識別方法,其特征在于,具體包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于改進yolov5網(wǎng)絡(luò)模型的側(cè)掃聲吶沉船目標(biāo)識別方法,其特征在于,數(shù)據(jù)預(yù)處理主要采用數(shù)據(jù)增強方式,包括圖像裁剪、圖像加噪、改變圖像亮度、圖像平移、圖像旋轉(zhuǎn)、圖像鏡像。
3.根據(jù)權(quán)利要求1所述的一種基于改進yolov5網(wǎng)絡(luò)模型的側(cè)掃聲吶沉船目標(biāo)識別方法,其特征在于,數(shù)據(jù)經(jīng)過預(yù)處理后按照比例將數(shù)據(jù)集隨機分割為訓(xùn)練集、評估集和測試集。
4.根據(jù)權(quán)利要求1所述的一種基于改進yolov5網(wǎng)絡(luò)模型的側(cè)掃聲吶沉船目標(biāo)識別方法,其特征在于,在更換后的backbone部分中,輸入層之后包括2個卷積層和15個ghostbottleneck層,整個backbone將在第5、9、16層得到三個接口分別與neck部分相連。
5.根據(jù)權(quán)利要求1所述的一種基于改進yolov5網(wǎng)絡(luò)模型的側(cè)掃聲吶沉船目標(biāo)識別方法,其特征在于,網(wǎng)絡(luò)模型的改進為選擇其中一種方式改進或者采用兩種方式改進。