本發(fā)明涉及計算機視覺,特別地,涉及一種基于改進yolov5的鞋墊沖裁材料檢測方法。
背景技術(shù):
1、鞋墊沖裁材料檢測是鞋墊制造過程中至關(guān)重要的一環(huán),其目的是在裁斷過程中精確識別并定位材料的位置和形狀,以確保裁斷精度和減少材料浪費。在傳統(tǒng)的鞋墊沖裁過程中,主要依賴人工目視檢測和手動調(diào)節(jié)裁斷機參數(shù),這種方式效率低下且存在較高的誤差率,尤其在處理復(fù)雜輪廓或大批量生產(chǎn)時,容易導(dǎo)致材料浪費或產(chǎn)品質(zhì)量不一致。近年來,隨著工業(yè)自動化技術(shù)的快速發(fā)展,機器視覺技術(shù)被逐步引入到裁斷機中,用于替代人工檢測。然而,傳統(tǒng)的機器視覺方法多基于模板匹配或簡單的特征提取算法,受限于算法的魯棒性,在應(yīng)對不同材質(zhì)、顏色、紋理和光照變化時表現(xiàn)不佳。此外,傳統(tǒng)方法對檢測精度和實時性要求較高的鞋墊沖裁場景仍顯力不從心。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明目的是提供一種基于改進yolov5的鞋墊沖裁材料檢測方法,能有效精準并快速的進行鞋墊沖裁材料的初步定位。
2、為了解決上述技術(shù)問題,本發(fā)明的技術(shù)方案是:一種基于改進yolov5的鞋墊沖裁材料檢測方法,在yolov5網(wǎng)絡(luò)模型的c3模塊中,用fasternet?block替代了bottleneckmu結(jié)構(gòu);并在yolov5模型的特征通道中引入se注意力機制;采用focal-eiou損失函數(shù)替代原ciou損失函數(shù),得到lightcut-yolov5網(wǎng)絡(luò)模型,還包括以下步驟:
3、s1、通過相機采集鞋墊裁斷材料圖像,構(gòu)建數(shù)據(jù)集;
4、s2、利用數(shù)據(jù)增強擴充數(shù)據(jù)集中的鞋墊裁斷材料圖像的數(shù)量,對擴充后的數(shù)據(jù)集進行預(yù)處理,再進行標注,并按照預(yù)設(shè)比例劃分訓(xùn)練集、測試集和驗證集;
5、s3、搭建lightcut-yolov5網(wǎng)絡(luò)模型;
6、s4、將步驟s2中的訓(xùn)練集輸入lightcut-yolov5網(wǎng)絡(luò)模型,然后通過lightcut-yolov5網(wǎng)絡(luò)模型檢測后輸出鞋墊沖裁材料的坐標;
7、s4.1、將步驟s2中的訓(xùn)練集輸入到主干網(wǎng)絡(luò)的c3f模塊,輸入圖像特征先通過通道注意力模塊進行卷積,然后再通過空間注意力模塊進行卷積,得到輸出主干網(wǎng)絡(luò)的輸出特征圖;
8、s4.2、將主干網(wǎng)絡(luò)的輸出特征圖通過小目標檢測層,對頂層的輸出特征圖與主干網(wǎng)絡(luò)中第2層的輸出特征圖進行融合,輸出融合特征圖;
9、s4.3、對融合特征圖進行檢測并輸出檢測鞋墊材料邊界框坐標;
10、s5、將步驟s4中l(wèi)ightcut-yolov5網(wǎng)絡(luò)模型進行評估,重復(fù)步驟s1~步驟s4,確定鞋墊沖裁材料圖像輸入模型,將待定位的鞋墊沖裁材料圖像輸入lightcut-yolov5網(wǎng)絡(luò)模型中進行檢測,并輸出檢測鞋墊材料邊界框坐標。
11、實現(xiàn)上述技術(shù)方案,通過采用數(shù)據(jù)增強來生成新的鞋墊沖裁材料圖像,從而擴充數(shù)據(jù)集的數(shù)量,能夠有效地緩解鞋墊沖裁材料圖像匱乏的問題,得到更多的數(shù)據(jù)樣本;通過將擴充后的數(shù)據(jù)樣本按比例劃分訓(xùn)練集、測試集和驗證集,便于后續(xù)能夠?qū)⒂?xùn)練集輸入lightcut-yolov5網(wǎng)絡(luò)模型中,從而對鞋墊沖裁材料圖像進行檢測,并輸出鞋墊材料邊界框坐標;用fasternet?block輕量化yolov5網(wǎng)絡(luò)模型中的c3模塊,fasternet?block是一種高效輕量化網(wǎng)絡(luò)結(jié)構(gòu),通過簡化計算復(fù)雜度和減少參數(shù)量,大幅降低模型的推理時間和內(nèi)存占用;提升模型的實時性:使得改進后的yolov5網(wǎng)絡(luò)能夠在高速生產(chǎn)線環(huán)境中實時檢測鞋墊沖裁材料;減少硬件資源依賴,輕量化設(shè)計降低了對高性能硬件的需求,便于在資源有限的嵌入式設(shè)備或工業(yè)設(shè)備中部署;引入se注意力機制,se注意力機制通過對特征通道的重要性進行動態(tài)加權(quán),使網(wǎng)絡(luò)能夠更有效地捕捉關(guān)鍵特征,同時抑制冗余信息;增強特征提取能力,在鞋墊材料紋理復(fù)雜、細節(jié)較多的場景下,se注意力機制幫助模型更準確地關(guān)注關(guān)鍵區(qū)域,提高檢測的魯棒性;提高模型適應(yīng)性,增強網(wǎng)絡(luò)對光照變化、材質(zhì)差異等復(fù)雜環(huán)境因素的適應(yīng)能力;用focal-eiou損失函數(shù)替換原有的ciou,focal-eiou在考慮預(yù)測框與真實框的重疊程度的同時,引入對長寬比例差異的懲罰,并通過焦點機制減小易分類樣本的權(quán)重,重點優(yōu)化困難樣本的檢測;提升定位精度,更精確地處理預(yù)測框的長寬比例差異,適應(yīng)鞋墊形狀多樣化的特點;優(yōu)化邊緣情況,更好地解決細小缺陷、復(fù)雜輪廓等難以檢測的情況,提高整體檢測性能;降低誤報率,通過聚焦難檢測樣本,減少對簡單樣本的過度優(yōu)化,從而降低誤報和漏報。
12、作為本發(fā)明的一種優(yōu)選方案,所述的步驟s2中鞋墊圖像數(shù)據(jù)通過mosaic函數(shù)進行數(shù)據(jù)增強。
13、實現(xiàn)上述技術(shù)方案,能夠隨機組合多張圖像來增加數(shù)據(jù)集中樣本的多樣性以及魯棒性。
14、作為本發(fā)明的一種優(yōu)選方案,所述的步驟s2的預(yù)處理包括矯正、歸一化處理。
15、實現(xiàn)上述技術(shù)方案,便于圖像符合輸入的lightcut-yolov5網(wǎng)絡(luò)的要求。
16、作為本發(fā)明的一種優(yōu)選方案,所述的步驟s2中標注采用的方式包括使用labelimg標注軟件對圖像中鞋墊沖裁材料中每個目標進行標注,并按照8:1:1比例劃分訓(xùn)練集、測試集和驗證集。
17、實現(xiàn)上述技術(shù)方案,方便進行標注,并創(chuàng)建數(shù)據(jù)庫,同時也能確保訓(xùn)練集具有足夠的數(shù)據(jù)量。
18、作為本發(fā)明的一種優(yōu)選方案,所述的步驟s3中的lightcut-yolov5網(wǎng)絡(luò)模型包括輸入端、主干網(wǎng)絡(luò)、頸部網(wǎng)絡(luò)和輸出端;
19、輸入端分別通過主干網(wǎng)絡(luò)和頸部網(wǎng)絡(luò)之后通過輸出端進行輸出;
20、主干網(wǎng)絡(luò)包括conv模塊、c3f模塊、se模塊和sppf模塊;
21、conv模塊包括卷積層、批次歸一化層和relu激活函數(shù);
22、c3f模塊包括第一路徑和第二路徑,第一路徑由conv模塊和兩個以上的faster_block模塊組成,第二路徑由pconv模塊和pwconv組成;
23、sppf模塊包括conv模塊和maxpool模塊;
24、cbam模塊包括通道注意力模塊和空間注意力模塊;
25、頸部網(wǎng)絡(luò)中包含多個c3f模塊用于進一步特征提取和融合。
26、實現(xiàn)上述技術(shù)方案,能夠顯著提高模型對鞋墊沖裁材料的關(guān)注度和敏感度,從而更好的提取融合特征。
27、作為本發(fā)明的一種優(yōu)選方案,所述的focal-elou損失函數(shù)采用focalloss思想對難檢測樣本賦予更高權(quán)重,并結(jié)合elou方式使預(yù)測框的長寬比與實際物體更加匹配,以實現(xiàn)更精確的邊界框回歸;其公式如下:
28、
29、其中,iou=|a∩b|/|a∪b|,γ為控制計算值,wc和hc為最小包圍框的寬和高,b和bgt表示預(yù)測框和真實框的中心坐標,p(.)表示中心點坐標的歐氏距離,wgt和hgt為真實框的寬和高,w和h為預(yù)測框的寬和高。
30、實現(xiàn)上述技術(shù)方案,對難檢測樣本賦予更高權(quán)重,并結(jié)合elou方式使預(yù)測框的長寬比與實際物體更加匹配,以實現(xiàn)更精確的邊界框回歸。