本技術(shù)涉及計(jì)算機(jī),尤其涉及一種深度估計(jì)方法、電子裝置、存儲介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、在自動(dòng)駕駛,機(jī)器人導(dǎo)航等領(lǐng)域,常常需要進(jìn)行深度估計(jì),以實(shí)現(xiàn)二維圖像向三維空間的映射;在目前相關(guān)的深度估計(jì)方法中,基于像素的深度估計(jì)方法對圖像噪聲高度敏感,環(huán)境光線變化、傳感器噪聲以及圖像壓縮等因素都會引入噪聲,從而導(dǎo)致深度估計(jì)結(jié)果的不穩(wěn)定和不準(zhǔn)確;而其他基于回波波形的深度估計(jì)方法則在面對復(fù)雜環(huán)境時(shí),存在多路徑反射的處理能力不足的缺陷,從而導(dǎo)致深度估計(jì)的準(zhǔn)確性和魯棒性較差。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供了一種深度估計(jì)方法、電子裝置、存儲介質(zhì)及程序產(chǎn)品,能夠有效提升深度估計(jì)的準(zhǔn)確性和魯棒性。
2、第一方面,本技術(shù)實(shí)施例提供了一種深度估計(jì)方法,方法包括:
3、獲取檢測場景的回波數(shù)據(jù)和圖像數(shù)據(jù);
4、對圖像數(shù)據(jù)中的各個(gè)像素點(diǎn)進(jìn)行位置編碼處理,得到各個(gè)像素點(diǎn)各自對應(yīng)的位置編碼;
5、對回波數(shù)據(jù)和位置編碼進(jìn)行特征融合處理,得到融合的特征信息;
6、基于融合的特征信息進(jìn)行深度估計(jì)處理,得到檢測場景對應(yīng)的深度估計(jì)結(jié)果。
7、在本實(shí)施例中,電子裝置可以獲取檢測場景的圖像數(shù)據(jù),并對圖像數(shù)據(jù)中的各個(gè)像素點(diǎn)進(jìn)行位置編碼,由此能夠捕捉像素點(diǎn)在二維的圖像數(shù)據(jù)中的空間位置;進(jìn)而可以利用回波數(shù)據(jù)和位置編碼進(jìn)行特征融合,使得融合的特征信既包含了回波數(shù)據(jù)提供的深度信息,又能夠嵌入像素點(diǎn)的空間位置信息,從而利用融合的特征信息進(jìn)行深度估計(jì)處理,能夠有效提升深度估計(jì)的準(zhǔn)確性和魯棒性。
8、進(jìn)一步,在一些實(shí)施例中,回波數(shù)據(jù)包括各個(gè)激光點(diǎn)對應(yīng)的回波信息;對回波數(shù)據(jù)和位置編碼進(jìn)行特征融合處理,得到融合的特征信息,包括:
9、對回波數(shù)據(jù)進(jìn)行預(yù)處理,得到各個(gè)激光點(diǎn)各自對應(yīng)的預(yù)處理后的回波信息;
10、在各個(gè)像素點(diǎn)對應(yīng)的位置編碼中,確定各個(gè)激光點(diǎn)分別對應(yīng)的目標(biāo)像素點(diǎn)的目標(biāo)位置編碼;
11、分別對各個(gè)激光點(diǎn)各自對應(yīng)的預(yù)處理后的回波信息和目標(biāo)位置編碼進(jìn)行拼接處理,得到各個(gè)激光點(diǎn)各自對應(yīng)的拼接后的特征信息;
12、對各個(gè)激光點(diǎn)各自對應(yīng)的拼接后的特征信息進(jìn)行線性變換處理,得到融合的特征信息。
13、在本實(shí)施例中,電子裝置可以對回波數(shù)據(jù)進(jìn)行預(yù)處理,得到各個(gè)激光點(diǎn)各自對應(yīng)的預(yù)處理后的回波信息,進(jìn)而在各個(gè)像素點(diǎn)對應(yīng)的位置編碼中,確定與各個(gè)激光點(diǎn)分別對應(yīng)的目標(biāo)像素點(diǎn)的目標(biāo)位置編碼,從而分別對每個(gè)激光點(diǎn)對應(yīng)的預(yù)處理后的回波信息和目標(biāo)位置編碼進(jìn)行拼接,得到每個(gè)激光點(diǎn)對應(yīng)的拼接后的特征信息,然后對拼接后的特征信息進(jìn)行線性變換處理,以提升融合的特征信息的語義表達(dá),從而提升后續(xù)深度估計(jì)的準(zhǔn)確性。
14、進(jìn)一步,在一些實(shí)施例中,基于融合的特征信息進(jìn)行深度估計(jì)處理,得到檢測場景對應(yīng)的深度估計(jì)結(jié)果,包括:
15、基于預(yù)設(shè)注意力模型對融合的特征信息進(jìn)行特征增強(qiáng)處理,得到第一特征信息;
16、基于預(yù)設(shè)深度估計(jì)模型對第一特征信息進(jìn)行深度估計(jì)處理,得到深度概率分布信息;
17、基于深度概率分布信息確定深度估計(jì)結(jié)果。
18、在本實(shí)施例中,電子裝置可以基于注意力機(jī)制對融合的特征信息進(jìn)行特征增強(qiáng)處理,以提升第一特征信息的表達(dá)能力,進(jìn)而利用預(yù)設(shè)深度估計(jì)模型對第一特征信息進(jìn)行深度估計(jì)處理,以基于得到的深度概率分布信息確定深度估計(jì)結(jié)果,能夠提升深度估計(jì)的準(zhǔn)確性。
19、進(jìn)一步,在一些實(shí)施例中,基于預(yù)設(shè)注意力模型對融合的特征信息進(jìn)行特征增強(qiáng)處理,得到第一特征信息,包括:
20、基于預(yù)設(shè)注意力模型對融合的特征信息進(jìn)行全局平均池化處理,得到融合的特征信息對應(yīng)的通道描述向量;
21、根據(jù)通道描述向量確定通道權(quán)重向量;
22、根據(jù)通道權(quán)重向量和融合的特征信息確定通道增強(qiáng)的特征向量;
23、基于通道增強(qiáng)的特征向量確定第一特征信息。
24、在本實(shí)施例中,在基于注意力機(jī)制對融合的特征信息進(jìn)行特征增強(qiáng)處理時(shí),可以先基于預(yù)設(shè)注意力模型對融合的特征信息進(jìn)行全局平均池化處理,得到通道描述向量,然后利用預(yù)設(shè)全連接神經(jīng)網(wǎng)絡(luò)模型生成通道描述向量對應(yīng)的通道權(quán)重向量,進(jìn)而根據(jù)通道權(quán)重向量和融合的特征信息確定通道增強(qiáng)的特征向量,并利用通道增強(qiáng)的特征向量確定第一特征信息,能夠?qū)θ诤系奶卣餍畔⒅械闹匾卣鬟M(jìn)行強(qiáng)化,從而提升特征表達(dá)。
25、進(jìn)一步,在一些實(shí)施例中,基于通道增強(qiáng)的特征向量確定第一特征信息,包括:
26、對通道增強(qiáng)的特征向量進(jìn)行通道維度的池化處理,得到空間描述向量;
27、根據(jù)空間描述向量生成空間權(quán)重圖;
28、根據(jù)空間權(quán)重圖和通道增強(qiáng)的特征向量確定第一特征信息。
29、在本實(shí)施例中,在基于通道增強(qiáng)的特征向量確定第一特征信息時(shí),可以對通道增強(qiáng)的特征向量進(jìn)行通道維度的池化處理,然后根據(jù)得到的空間描述向量生成空間權(quán)重圖,從而根據(jù)空間權(quán)重圖和通道增強(qiáng)的特征向量確定第一特征信息,能夠有效增強(qiáng)第一特征信息的表達(dá)能力,從而提升后續(xù)深度估計(jì)的魯棒性。
30、進(jìn)一步,在一些實(shí)施例中,基于預(yù)設(shè)深度估計(jì)模型對第一特征信息進(jìn)行深度估計(jì)處理,得到深度概率分布信息,包括:
31、基于預(yù)設(shè)深度估計(jì)模型和第一特征信息進(jìn)行峰值檢測處理,得到各個(gè)激光點(diǎn)各自對應(yīng)的峰值點(diǎn)和峰值點(diǎn)的深度值;
32、基于深度值確定各個(gè)激光點(diǎn)的峰值點(diǎn)對應(yīng)的深度概率信息;
33、根據(jù)各個(gè)激光點(diǎn)各自對應(yīng)的深度概率信息確定各個(gè)激光點(diǎn)各自對應(yīng)的深度概率分布信息。
34、在本實(shí)施例中,在基于預(yù)設(shè)深度估計(jì)模型對第一特征信息進(jìn)行深度估計(jì)處理時(shí),可以先進(jìn)行峰值檢測處理,得到各個(gè)激光點(diǎn)各自對應(yīng)的峰值點(diǎn)和峰值點(diǎn)的深度值,然后分別基于深度值確定深度概率信息,進(jìn)而根據(jù)各個(gè)激光點(diǎn)各自對應(yīng)的深度概率信息確定深度概率分布信息,能夠提升深度概率分布信息的準(zhǔn)確性。
35、進(jìn)一步,在一些實(shí)施例中,基于深度概率分布信息確定深度估計(jì)結(jié)果,包括:
36、根據(jù)各個(gè)激光點(diǎn)各自對應(yīng)的深度概率分布信息確定深度概率分布期望值,并根據(jù)深度概率分布期望值確定深度估計(jì)結(jié)果;或者,
37、根據(jù)各個(gè)激光點(diǎn)各自對應(yīng)的深度概率分布信息的最大似然估計(jì)值確定深度估計(jì)結(jié)果。
38、在本實(shí)施例中,在基于深度概率分布信息確定深度估計(jì)結(jié)果時(shí),可以根據(jù)各個(gè)激光點(diǎn)各自對應(yīng)的深度概率分布信息和深度值計(jì)算深度概率分布期望值,從而將各個(gè)激光點(diǎn)對應(yīng)的深度概率分布期望值確定為深度估計(jì)結(jié)果,或者,還可以根據(jù)各個(gè)激光點(diǎn)各自對應(yīng)的深度概率分布信息的最大似然估計(jì)值確定深度估計(jì)結(jié)果,能夠有效提升深度估計(jì)結(jié)果的準(zhǔn)確性。
39、進(jìn)一步,在一些實(shí)施例中,對圖像數(shù)據(jù)中的各個(gè)像素點(diǎn)進(jìn)行位置編碼處理,得到各個(gè)像素點(diǎn)各自對應(yīng)的位置編碼,包括:
40、分別對圖像數(shù)據(jù)中的各個(gè)像素點(diǎn)進(jìn)行水平位置編碼處理和垂直位置編碼處理,得到各個(gè)像素點(diǎn)各自的水平位置編碼和垂直位置編碼;
41、分別對各個(gè)像素點(diǎn)各自的水平位置編碼和垂直位置編碼進(jìn)行拼接處理,得到各個(gè)像素點(diǎn)各自對應(yīng)的位置編碼。
42、在本實(shí)施例中,在確定各個(gè)像素點(diǎn)各自對應(yīng)的位置編碼時(shí),是分別確定各個(gè)像素點(diǎn)的水平位置編碼和垂直位置編碼,從而對水平位置編碼和垂直位置編碼進(jìn)行拼接,得到各個(gè)像素點(diǎn)的位置編碼,能夠在不增加額外的參數(shù)負(fù)擔(dān)的情況下,有效捕捉像素點(diǎn)的空間位置,以提升深度估計(jì)的準(zhǔn)確性。
43、第二方面,本技術(shù)實(shí)施例提供了一種電子裝置,電子裝置包括獲取單元、編碼單元、融合單元以及深度估計(jì)單元;
44、獲取單元,用于獲取檢測場景的回波數(shù)據(jù)和圖像數(shù)據(jù);
45、編碼單元,用于對圖像數(shù)據(jù)中的各個(gè)像素點(diǎn)進(jìn)行位置編碼處理,得到各個(gè)像素點(diǎn)各自對應(yīng)的位置編碼;
46、融合單元,用于對回波數(shù)據(jù)和位置編碼進(jìn)行特征融合處理,得到融合的特征信息;
47、深度估計(jì)單元,用于基于融合的特征信息進(jìn)行深度估計(jì)處理,得到檢測場景對應(yīng)的深度估計(jì)結(jié)果。
48、在本實(shí)施例中,電子裝置可以獲取檢測場景的圖像數(shù)據(jù),并對圖像數(shù)據(jù)中的各個(gè)像素點(diǎn)進(jìn)行位置編碼,由此能夠捕捉像素點(diǎn)在二維的圖像數(shù)據(jù)中的空間位置;進(jìn)而可以利用回波數(shù)據(jù)和位置編碼進(jìn)行特征融合,使得融合的特征信既包含了回波數(shù)據(jù)提供的深度信息,又能夠嵌入像素點(diǎn)的空間位置信息,從而利用融合的特征信息進(jìn)行深度估計(jì)處理,能夠有效提升深度估計(jì)的準(zhǔn)確性和魯棒性。
49、第三方面,本技術(shù)實(shí)施例提供了一種電子裝置,電子裝置包括處理器、存儲有處理器可執(zhí)行指令的存儲器;當(dāng)指令被處理器執(zhí)行時(shí),實(shí)現(xiàn)上述深度估計(jì)方法。
50、第四方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)上述深度估計(jì)方法。
51、第五方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí),實(shí)現(xiàn)上述深度估計(jì)方法中的步驟。