本發(fā)明涉及基于深度學(xué)習(xí)的水下圖像處理。具體來說涉及一種輕量級水下圖像動態(tài)增強方法。
背景技術(shù):
1、水下人機交互(u-hri)是一項新興技術(shù),探索并優(yōu)化人類、計算機系統(tǒng)和智能設(shè)備在水下環(huán)境中的交互。隨著水下活動的增多,如海洋資源開發(fā)、環(huán)境監(jiān)測和科學(xué)研究,對高效、直觀的水下交互技術(shù)的需求顯著增長。u-hri的發(fā)展促進了海洋探索,為海洋資源研究提供了創(chuàng)新的解決方案。然而,圖像模糊是限制u-hri在水下任務(wù)中表現(xiàn)和效率的關(guān)鍵因素。水下環(huán)境的特殊性使得通過自主水下航行器(auv)拍攝清晰圖像變得極具挑戰(zhàn)性。隨著深度增加,水下光的吸收和散射加劇,顯著降低了圖像的對比度和亮度。不同波長的光在水下以不同的速度衰減,紅光衰減最快,藍光衰減最慢,導(dǎo)致圖像主要呈現(xiàn)藍色或綠色。懸浮顆粒和微生物的存在進一步加劇了圖像的退化。此外,水下環(huán)境高度動態(tài),光照不均且湍流引起的相對運動常常導(dǎo)致相機和目標之間的模糊圖像??紤]到上述因素,水下圖像增強(uie)技術(shù)的研究對于準確理解水下世界,提升u-hri的效率和安全性至關(guān)重要。
技術(shù)實現(xiàn)思路
1、發(fā)明目的:針對水下機器人攝像頭在處理復(fù)雜的水下環(huán)境時難以應(yīng)對水下圖像模糊,嚴重影響自動化系統(tǒng)的表現(xiàn)的問題。本發(fā)明提供了一種輕量級水下圖像動態(tài)增強方法,利用多尺度頻率分析來應(yīng)對這一挑戰(zhàn)。
2、本發(fā)明所采用的技術(shù)方案如下:
3、本發(fā)明提供一種輕量級水下圖像動態(tài)增強方法,其特征在于:步驟為:
4、步驟一:使用多尺度增強先驗算法增強原始水下圖像的高頻和低頻特征信息,得到多尺度先驗圖像信息;
5、步驟二:使用基于頻域的卷積注意力機制去提取多尺度先驗圖像信息的頻域特征信息,得到多尺度頻域信息;
6、步驟三:在步驟二的基礎(chǔ)上,將多尺度頻域信息輸入信息流交互算法去解決特征信息的分層和阻塞問題;
7、步驟四:利用多尺度級聯(lián)損失算法激發(fā)網(wǎng)絡(luò)動態(tài)優(yōu)化。
8、步驟五:在步驟四的基礎(chǔ)上,將原始水下圖像輸入到優(yōu)化后的網(wǎng)絡(luò)中,得到增強后的水下圖像;
9、進一步的,步驟一中多尺度增強先驗算法的增強步驟為:
10、步驟1-1:使用雙線性下采樣將原始水下圖像連續(xù)下采樣兩次得到多尺度圖像,其中原始水下圖像i1尺寸為hi×wi×ni;其中hi代表圖像的長度尺寸,wi代表圖像的寬度尺寸,ni代表圖像的通道尺寸;兩次下采樣后分別得到尺寸為的圖像i2和尺寸為的圖像i3;
11、步驟1-2:獲取自適應(yīng)圖像增強系數(shù),將多尺度圖像[i1,i2,i3]輸入到多尺度增強先驗?zāi)K中,得到圖像增強系數(shù)r(c1,c2,c3,c4,c5);
12、步驟1-3:利用得到的圖像增強系數(shù)r(c1,c2,c3,c4,c5),對多尺度圖像進行亮度調(diào)整、對比度調(diào)整、飽和度調(diào)整、伽馬變換和銳度調(diào)整,得到多尺度先驗圖像[e1,e2,e3];
13、進一步的,步驟1-2中,多尺度增強先驗?zāi)K表示為:
14、
15、式中,為增強系數(shù)r′(c1,c2,c3,c4,c5),poolmax和poolmean分別為最大池化和平均池化,mhsa代表多頭注意力機制,為輸入特征,其表示為:
16、
17、式中,fin為輸入的多尺度圖像[i1,i2,i3],conv為卷積操作,cn(*)為條件歸一化函數(shù),其表示為:
18、cn(*)=bn(fin)*(1+α)+β
19、式中,bn(*)為批量歸一化,α和β分別是通過卷積操作生成的縮放因子和偏移因子;
20、將得到的增強系數(shù)r′(c1,c2,c3,c4,c5)限定在固定范圍內(nèi):c1=[0.3,1.3],c2=[0.5,1.5],c3=[1.0,2.0],c4=[0.5,1.5],c5=[1.0,5.0],得到最終的增強系數(shù)r(c1,c2,c3,c4,c5);其限定函數(shù)表示如下:
21、
22、式中,vmax和vmin分別為增強系數(shù)的最大值和最小值,x為初始增強系數(shù)r′(c1,c2,c3,c4,c5);
23、進一步的,步驟1-3中,亮度調(diào)整、對比度調(diào)整、飽和度調(diào)整、伽馬變換和銳度調(diào)整表示分別如下:
24、imagebrightness=fin*c1
25、imagecontrast=fin*c3+(1-c3)*meangray(fin)
26、imagesaturation=fin*c4+(1-c4)*gray(fin)
27、
28、imagesharpness=fin*c5+(1-c5)*laplace(fin)
29、式中,fin為輸入的多尺度圖像[i1,i2,i3],meangray(*),gray(fin)和laplace(fin)分別為平均灰度轉(zhuǎn)換,灰度轉(zhuǎn)換和拉普拉斯高通濾波;
30、進一步的,步驟二中基于頻域的卷積注意力機制表示為:
31、a=conv(ifft(s)+dscv(finput))+finput
32、式中,ifft(*)為逆向傅里葉變換,finput為輸入的多尺度先驗圖像[e1,e2,e3],dsc(*)為深度可分離卷積,s表示為:
33、s=convgelu(q⊙k)⊙v
34、式中,⊙表示逐元素點乘操作,q,k,v表示為:
35、q,k,v=fftq,k,v(dscq,k,v(conv(finput)))
36、式中,fft(*)表示為傅里葉變換;
37、通過將多尺度先驗圖像[e1,e2,e3]輸入到基于頻域的卷積注意力機制中進行頻域特征提取,得到多尺度頻域信息[f1,f2,f3];
38、進一步的,步驟三中信息流交互算法表示為:
39、
40、式中,分別表示為:
41、
42、式中,c為多尺度頻域信息的通道個數(shù),表示第i個通道的特征信息,表示為:
43、
44、式中為多尺度頻域信息[f1,f2,f3],linears表示為:
45、a=linear(poolmax(fin)+poolmean(fin))sigmoid
46、進一步的,步驟四中多尺度級聯(lián)損失算法表示為:
47、
48、式中,α,β為相關(guān)系數(shù),其中α=0.9,β=0.1;為多尺度均值絕對誤差,為多尺度頻域誤差,其表示分別如下:
49、
50、
51、式中,n為優(yōu)化一次模型的數(shù)據(jù)批次,pi,分別為真實值和預(yù)測值,fft(*)為傅里葉變換;
52、有益效果:
53、本發(fā)明為一種輕量級水下圖像動態(tài)增強方法,使用多尺度增強先驗算法增強水下圖像的高頻和低頻特征信息,得到多尺度先驗圖像信息;使用基于頻域的卷積注意力機制去提取多尺度先驗圖像信息的頻域特征信息,得到多尺度頻域信息;將多尺度頻域信息輸入信息流交互算法去解決特征信息的分層和阻塞問題;最后利用多尺度級聯(lián)損失算法激發(fā)網(wǎng)絡(luò)動態(tài)優(yōu)化,最終得到增強后的水下圖像。本發(fā)明可以部署在水下機器人中,在消耗更少計算資源的同時,很好地解決水下機器人攝像頭在復(fù)雜的水下環(huán)境中存在圖像退化問題,且增強后的圖像與人類視覺感知的匹配度更高。