本技術(shù)涉及互聯(lián)網(wǎng),特別涉及訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)的方法和裝置、目標(biāo)對象檢測方法和裝置、計(jì)算設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、當(dāng)下,基于弱監(jiān)督技術(shù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)的技術(shù)蓬勃發(fā)展。針對檢測圖像數(shù)據(jù)的目標(biāo)檢測網(wǎng)絡(luò),因?yàn)椴扇×巳醣O(jiān)督技術(shù),在訓(xùn)練前無需再為各個(gè)圖像樣本標(biāo)定目標(biāo)對象所在的區(qū)域,這節(jié)約了大量勞動(dòng)。但是在訓(xùn)練過程中,由于沒有預(yù)先標(biāo)定目標(biāo)對象所在的準(zhǔn)確的區(qū)域,所訓(xùn)練出來的目標(biāo)檢測網(wǎng)絡(luò)往往存在一定的誤差,無法準(zhǔn)確預(yù)測目標(biāo)對象所在的區(qū)域和類別。如何提高目標(biāo)檢測網(wǎng)絡(luò)的準(zhǔn)確性,是一個(gè)亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、鑒于此,本技術(shù)提供了一種訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)的方法和裝置、目標(biāo)對象檢測方法和裝置、計(jì)算設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品,期望緩解或克服上面提到的部分或全部缺陷以及其他可能的缺陷。
2、根據(jù)本技術(shù)的第一方面,提供了一種訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)的方法,包括:獲取多個(gè)圖像樣本集,每個(gè)圖像樣本集中的每個(gè)圖像樣本包括至少一個(gè)目標(biāo)對象,每個(gè)目標(biāo)對象具有對應(yīng)的類別標(biāo)簽,所述多個(gè)圖像樣本集中的每個(gè)圖像樣本集具有至少一個(gè)不同于其他圖像樣本集的樣本分布特征;針對所述多個(gè)圖像樣本集中的每個(gè)圖像樣本集的每個(gè)圖像樣本,執(zhí)行下述步驟:將所述圖像樣本輸入到所述目標(biāo)檢測網(wǎng)絡(luò)中的整體特征提取網(wǎng)絡(luò),以得到所述圖像樣本的整體特征;將所述圖像樣本的整體特征輸入到所述目標(biāo)檢測網(wǎng)絡(luò)中的分布特征提取網(wǎng)絡(luò),以得到所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布特征;將所述圖像樣本的整體特征輸入到所述目標(biāo)檢測網(wǎng)絡(luò)中的候選區(qū)域特征網(wǎng)絡(luò),以確定所述圖像樣本中所述至少一個(gè)目標(biāo)對象所在的至少一個(gè)候選區(qū)域的特征,所述至少一個(gè)候選區(qū)域與所述至少一個(gè)目標(biāo)對象一一對應(yīng);將所述圖像樣本的每個(gè)候選區(qū)域的特征與所述圖像樣本對應(yīng)的圖像樣本集的所述至少一個(gè)樣本分布特征融合,以得到所述圖像樣本的各個(gè)候選區(qū)域的優(yōu)化特征;將所述圖像樣本的各個(gè)候選區(qū)域的優(yōu)化特征輸入到目標(biāo)檢測網(wǎng)絡(luò)的檢測頭網(wǎng)絡(luò),以得到所述圖像樣本中各個(gè)目標(biāo)對象的預(yù)測類別和所在的預(yù)測區(qū)域;根據(jù)所述多個(gè)圖像樣本集中的每個(gè)圖像樣本集中每個(gè)圖像樣本中的每個(gè)目標(biāo)對象的類別標(biāo)簽和該目標(biāo)對象的預(yù)測類別和所在的預(yù)測區(qū)域,調(diào)整所述目標(biāo)檢測網(wǎng)絡(luò)的參數(shù)。
3、在根據(jù)本技術(shù)的一些實(shí)施例中,所述分布特征提取網(wǎng)絡(luò)包括池化層、預(yù)設(shè)數(shù)量的全連接層、激活函數(shù)層和分布特征層,所述分布特征層是由多個(gè)一維向量構(gòu)成的矩陣,并且所述將所述圖像樣本的整體特征輸入到所述目標(biāo)檢測網(wǎng)絡(luò)中的分布特征提取網(wǎng)絡(luò),以得到所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布特征,包括:將所述圖像樣本的整體特征輸入到所述池化層,以得到經(jīng)池化處理的整體特征;將所述經(jīng)池化處理的整體特征輸入到所述預(yù)設(shè)數(shù)量的全連接層,以得到所述圖像樣本的分布特征系數(shù);將所述圖像樣本的分布特征系數(shù)輸入到激活函數(shù)層,以得到經(jīng)優(yōu)化的分布特征系數(shù);將所述經(jīng)優(yōu)化的分布特征系數(shù)輸入到所述分布特征層,以得到所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布特征。
4、在根據(jù)本技術(shù)的一些實(shí)施例中,所述池化層是最大池化層和平均池化層中的一種。
5、在根據(jù)本技術(shù)的一些實(shí)施例中,所述激活函數(shù)層是雙曲正切(tanh)函數(shù)層和線性整流(relu)函數(shù)層中的一種。
6、在根據(jù)本技術(shù)的一些實(shí)施例中,所述將所述經(jīng)優(yōu)化的分布特征系數(shù)輸入到所述分布特征層,以得到所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布特征,包括:將所述經(jīng)優(yōu)化的分布特征系數(shù)乘以所述分布特征層的各個(gè)一維向量,以得到二維矩陣;將所述二維矩陣確定為所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布特征。
7、在根據(jù)本技術(shù)的一些實(shí)施例中,所述候選區(qū)域特征網(wǎng)絡(luò)包括候選區(qū)域確定網(wǎng)絡(luò)和候選區(qū)域整體特征提取網(wǎng)絡(luò),并且所述將所述圖像樣本的整體特征輸入到所述目標(biāo)檢測網(wǎng)絡(luò)中的候選區(qū)域特征網(wǎng)絡(luò),以確定所述圖像樣本中所述至少一個(gè)目標(biāo)對象所在的至少一個(gè)候選區(qū)域的特征,包括:將所述圖像樣本輸入到所述候選區(qū)域確定網(wǎng)絡(luò),以得到所述圖像樣本的至少一個(gè)候選區(qū)域;將所述圖像樣本的至少一個(gè)候選區(qū)域和所述圖像樣本的整體特征輸入到所述候選區(qū)域整體特征提取網(wǎng)絡(luò),以得到所述圖像樣本的各個(gè)候選區(qū)域的特征。
8、在根據(jù)本技術(shù)的一些實(shí)施例中,所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布特征分別由至少一個(gè)樣本分布向量表示,并且,所述將所述圖像樣本的每個(gè)候選區(qū)域的特征與所述圖像樣本對應(yīng)的圖像樣本集的所述至少一個(gè)樣本分布特征融合,以得到所述圖像樣本的各個(gè)候選區(qū)域的優(yōu)化特征,包括:針對將所述圖像樣本的每個(gè)候選區(qū)域的特征,執(zhí)行下述操作:將所述候選區(qū)域的特征與所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布向量進(jìn)行相加運(yùn)算,以得到第一融合結(jié)果;將所述候選區(qū)域的特征與所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布向量進(jìn)行相減運(yùn)算,以得到第二融合結(jié)果;將所述候選區(qū)域的特征與所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布向量進(jìn)行相乘運(yùn)算,以得到第三融合結(jié)果;將所述候選區(qū)域的特征與所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布向量進(jìn)行相除運(yùn)算,以得到第四融合結(jié)果;根據(jù)所述第一融合結(jié)果、第二融合結(jié)果、第三融合結(jié)果、第四融合結(jié)果中的至少一個(gè)確定所述圖像樣本的所述候選區(qū)域的優(yōu)化特征。
9、根據(jù)本技術(shù)的第二方面,提供了一種目標(biāo)對象檢測方法,包括:獲取待檢測圖像,所述待檢測圖像包括至少一個(gè)待檢測目標(biāo)對象;將所述待檢測圖像輸入到根據(jù)權(quán)利要求1所述的目標(biāo)檢測網(wǎng)絡(luò)以得到所述待檢測圖像中所述至少一個(gè)目標(biāo)對象的類別和所在的區(qū)域。
10、根據(jù)本技術(shù)的第三方面,提供了一種訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)的裝置,包括:處理模塊,配置為獲取多個(gè)圖像樣本集,每個(gè)圖像樣本集中的每個(gè)圖像樣本包括至少一個(gè)目標(biāo)對象,每個(gè)目標(biāo)對象具有對應(yīng)的類別標(biāo)簽,所述多個(gè)圖像樣本集中的每個(gè)圖像樣本集具有至少一個(gè)不同于其他圖像樣本集的樣本分布特征;針對所述多個(gè)圖像樣本集中的每個(gè)圖像樣本集的每個(gè)圖像樣本,執(zhí)行下述步驟:將所述圖像樣本輸入到所述目標(biāo)檢測網(wǎng)絡(luò)中的整體特征提取網(wǎng)絡(luò),以得到所述圖像樣本的整體特征;將所述圖像樣本的整體特征輸入到所述目標(biāo)檢測網(wǎng)絡(luò)中的分布特征提取網(wǎng)絡(luò),以得到所述圖像樣本對應(yīng)的圖像樣本集的至少一個(gè)樣本分布特征;將所述圖像樣本的整體特征輸入到所述目標(biāo)檢測網(wǎng)絡(luò)中的候選區(qū)域特征網(wǎng)絡(luò),以確定所述圖像樣本中所述至少一個(gè)目標(biāo)對象所在的至少一個(gè)候選區(qū)域的特征,所述至少一個(gè)候選區(qū)域與所述至少一個(gè)目標(biāo)對象一一對應(yīng);將所述圖像樣本的每個(gè)候選區(qū)域的特征與所述圖像樣本對應(yīng)的圖像樣本集的所述至少一個(gè)樣本分布特征融合,以得到所述圖像樣本的各個(gè)候選區(qū)域的優(yōu)化特征;將所述圖像樣本的各個(gè)候選區(qū)域的優(yōu)化特征輸入到目標(biāo)檢測網(wǎng)絡(luò)的檢測頭網(wǎng)絡(luò),以得到所述圖像樣本中各個(gè)目標(biāo)對象的預(yù)測類別和所在的預(yù)測區(qū)域;調(diào)整模塊,配置為根據(jù)所述多個(gè)圖像樣本集中的每個(gè)圖像樣本集中每個(gè)圖像樣本中的每個(gè)目標(biāo)對象的類別標(biāo)簽和該目標(biāo)對象的預(yù)測類別和所在的預(yù)測區(qū)域,調(diào)整所述目標(biāo)檢測網(wǎng)絡(luò)的參數(shù)。
11、根據(jù)本技術(shù)的第四方面,提供了一種目標(biāo)對象檢測裝置,包括:獲取模塊,配置為獲取待檢測圖像,所述待檢測圖像包括至少一個(gè)待檢測目標(biāo)對象;檢測模塊,配置為將所述待檢測圖像輸入到根據(jù)權(quán)利要求1所述的目標(biāo)檢測網(wǎng)絡(luò)以得到所述待檢測圖像中所述至少一個(gè)目標(biāo)對象的類別和所在的區(qū)域。
12、根據(jù)本技術(shù)的第五方面,提供了一種計(jì)算設(shè)備,包括存儲(chǔ)器和處理器,其中所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被所述處理器執(zhí)行時(shí)促使所述處理器執(zhí)行根據(jù)本技術(shù)一些實(shí)施例的訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)的方法的步驟。
13、根據(jù)本技術(shù)的第六方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令在被執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)本技術(shù)一些實(shí)施例的訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)的方法。
14、根據(jù)本技術(shù)的第七方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,計(jì)算機(jī)指令在被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)本技術(shù)一些實(shí)施例的訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)的方法。
15、在根據(jù)本技術(shù)一些實(shí)施例的訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò)的方法和裝置中,使用多個(gè)圖像樣本集來訓(xùn)練目標(biāo)檢測網(wǎng)絡(luò),由于各個(gè)圖像樣本集具有不同的樣本分布特征,因此可以為訓(xùn)練過程提供不同的樣本分布特征;目標(biāo)檢測網(wǎng)絡(luò)中的分布特征提取網(wǎng)絡(luò)可以從圖像樣本的整體特征中提取樣本分布特征,并將候選區(qū)域的特征與樣本分布特征融合,從而在各個(gè)候選區(qū)域的特征中減少樣本分布特征所帶來的影響,這樣可以在各個(gè)候選區(qū)域處排除干擾因素,從而得到更為準(zhǔn)確的優(yōu)化特征,這有利于提高檢測目標(biāo)對象的區(qū)域的準(zhǔn)確率。區(qū)域的準(zhǔn)確率的提高也會(huì)導(dǎo)致類別的準(zhǔn)確率的提高,因此經(jīng)訓(xùn)練的目標(biāo)檢測網(wǎng)絡(luò)具有更高的準(zhǔn)確率。
16、根據(jù)下文描述的實(shí)施例,本技術(shù)的這些和其它優(yōu)點(diǎn)將變得清楚,并且參考下文描述的實(shí)施例來闡明本技術(shù)的這些和其它優(yōu)點(diǎn)。