本申請(qǐng)涉及計(jì)算機(jī),具體涉及一種圖像識(shí)別方法、裝置、存儲(chǔ)介質(zhì)、設(shè)備及程序產(chǎn)品。
背景技術(shù):
1、相關(guān)技術(shù)中,以敏感圖像識(shí)別為代表的細(xì)標(biāo)簽識(shí)別任務(wù),通常采用“多模型識(shí)別+策略規(guī)則組合”的復(fù)雜解決方案。這一方法在過(guò)去有效地解決了眾多業(yè)務(wù)問(wèn)題,但隨著業(yè)務(wù)的持續(xù)擴(kuò)展與深化,其固有的局限性也日益凸顯。
2、首先,隨著業(yè)務(wù)需求的不斷增長(zhǎng),需要識(shí)別和分類的敏感圖像細(xì)標(biāo)簽數(shù)量急劇增加,這直接導(dǎo)致所需模型的數(shù)量和復(fù)雜度大幅提升。同時(shí),為了應(yīng)對(duì)各種特殊情況,策略規(guī)則的數(shù)量和復(fù)雜性也隨之增加,從而顯著提高了擴(kuò)展成本和維護(hù)成本。
3、其次,在敏感圖像識(shí)別的標(biāo)準(zhǔn)上,不同對(duì)象之間存在顯著的差異。由于敏感標(biāo)準(zhǔn)的主觀性和多樣性,對(duì)象對(duì)于敏感圖像的定義往往各不相同。這種差異在人工智能生成內(nèi)容(artificial?intelligence?generated?content,aigc)技術(shù)快速發(fā)展的背景下變得更加明顯,因?yàn)閳D像內(nèi)容的生成速度加快,數(shù)據(jù)邊界日益模糊,使得部分對(duì)象低于敏感圖像的標(biāo)準(zhǔn)難以用文字進(jìn)行客觀、準(zhǔn)確的描述。
4、因此,進(jìn)行自定義敏感圖像識(shí)別的難度越來(lái)越大,如何實(shí)現(xiàn)更加高效、靈活且可自定義的敏感圖像識(shí)別方法,成為當(dāng)前亟待解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種圖像識(shí)別方法、存儲(chǔ)介質(zhì)、設(shè)備及程序產(chǎn)品,可以簡(jiǎn)易、準(zhǔn)確地實(shí)現(xiàn)對(duì)象自定義敏感圖像識(shí)別,具備良好的遷移性,能夠針對(duì)不同對(duì)象的自定義敏感圖像標(biāo)準(zhǔn)進(jìn)行定制,提高自定義敏感圖像識(shí)別效果。
2、一方面,本申請(qǐng)實(shí)施例提供一種圖像識(shí)別方法,所述方法包括:
3、獲取待識(shí)別圖像;
4、將所述待識(shí)別圖像輸入目標(biāo)識(shí)別模型進(jìn)行圖像識(shí)別,以獲取所述目標(biāo)識(shí)別模型的輸出結(jié)果,所述輸出結(jié)果包括至少一個(gè)預(yù)測(cè)類別與每個(gè)預(yù)測(cè)類別對(duì)應(yīng)的概率值;
5、根據(jù)所述輸出結(jié)果確定所述待識(shí)別圖像的所屬類別;
6、其中,所述目標(biāo)識(shí)別模型是根據(jù)自定義敏感圖像數(shù)據(jù)集對(duì)視覺(jué)領(lǐng)域大模型進(jìn)行訓(xùn)練得到,所述視覺(jué)領(lǐng)域大模型是根據(jù)無(wú)標(biāo)簽的初始敏感圖像數(shù)據(jù)集對(duì)通用視覺(jué)大模型進(jìn)行訓(xùn)練得到。
7、另一方面,本申請(qǐng)實(shí)施例提供一種圖像識(shí)別裝置,所述裝置包括:
8、獲取單元,用于獲取待識(shí)別圖像;
9、識(shí)別單元,用于將所述待識(shí)別圖像輸入目標(biāo)識(shí)別模型進(jìn)行圖像識(shí)別,以獲取所述目標(biāo)識(shí)別模型的輸出結(jié)果,所述輸出結(jié)果包括至少一個(gè)預(yù)測(cè)類別與每個(gè)預(yù)測(cè)類別對(duì)應(yīng)的概率值;
10、確定單元,用于根據(jù)所述輸出結(jié)果確定所述待識(shí)別圖像的所屬類別;
11、其中,所述目標(biāo)識(shí)別模型是根據(jù)自定義敏感圖像數(shù)據(jù)集對(duì)視覺(jué)領(lǐng)域大模型進(jìn)行訓(xùn)練得到,所述視覺(jué)領(lǐng)域大模型是根據(jù)無(wú)標(biāo)簽的初始敏感圖像數(shù)據(jù)集對(duì)通用視覺(jué)大模型進(jìn)行訓(xùn)練得到。
12、另一方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序適于處理器進(jìn)行加載,以執(zhí)行如上任一實(shí)施例所述的方法。
13、另一方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括處理器和存儲(chǔ)器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器通過(guò)調(diào)用所述存儲(chǔ)器中存儲(chǔ)的所述計(jì)算機(jī)程序,用于執(zhí)行如上任一實(shí)施例所述的圖像識(shí)別方法。
14、另一方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一實(shí)施例所述的方法。
15、本申請(qǐng)實(shí)施例提供的獲取待識(shí)別圖像;將所述待識(shí)別圖像輸入目標(biāo)識(shí)別模型進(jìn)行圖像識(shí)別,以獲取所述目標(biāo)識(shí)別模型的輸出結(jié)果,所述輸出結(jié)果包括至少一個(gè)預(yù)測(cè)類別與每個(gè)預(yù)測(cè)類別對(duì)應(yīng)的概率值;根據(jù)所述輸出結(jié)果確定所述待識(shí)別圖像的所屬類別;其中,所述目標(biāo)識(shí)別模型是根據(jù)自定義敏感圖像數(shù)據(jù)集對(duì)視覺(jué)領(lǐng)域大模型進(jìn)行訓(xùn)練得到,所述視覺(jué)領(lǐng)域大模型是根據(jù)無(wú)標(biāo)簽的初始敏感圖像數(shù)據(jù)集對(duì)通用視覺(jué)大模型進(jìn)行訓(xùn)練得到的方案,利用通用視覺(jué)大模型構(gòu)建視覺(jué)領(lǐng)域大模型,再利用自定義敏感圖像數(shù)據(jù)集對(duì)視覺(jué)領(lǐng)域大模型進(jìn)行訓(xùn)練,得到目標(biāo)識(shí)別模型,從而使得目標(biāo)識(shí)別模型能夠高效、準(zhǔn)確地實(shí)現(xiàn)對(duì)象自定義敏感圖像識(shí)別,具備良好的遷移性,能夠針對(duì)不同對(duì)象的自定義敏感圖像標(biāo)準(zhǔn)進(jìn)行定制,提高自定義敏感圖像識(shí)別效果。
1.一種圖像識(shí)別方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的圖像識(shí)別方法,其特征在于,所述視覺(jué)領(lǐng)域大模型的訓(xùn)練步驟,包括:
3.如權(quán)利要求1或2所述的圖像識(shí)別方法,其特征在于,所述目標(biāo)識(shí)別模型的訓(xùn)練步驟,包括:
4.如權(quán)利要求3所述的圖像識(shí)別方法,其特征在于,所述根據(jù)所述自定義敏感圖像數(shù)據(jù)集對(duì)所述視覺(jué)領(lǐng)域大模型進(jìn)行第一參數(shù)調(diào)整處理,得到所述目標(biāo)識(shí)別模型,包括:
5.如權(quán)利要求3所述的圖像識(shí)別方法,其特征在于,所述方法還包括:
6.如權(quán)利要求5所述的圖像識(shí)別方法,其特征在于,所述根據(jù)不同對(duì)象標(biāo)注的不同自定義敏感圖像數(shù)據(jù)集,對(duì)所述目標(biāo)識(shí)別模型進(jìn)行第二參數(shù)調(diào)整處理,得到適用于不同對(duì)象的新目標(biāo)識(shí)別模型,包括:
7.一種圖像識(shí)別裝置,其特征在于,所述裝置包括:
8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序適于處理器進(jìn)行加載,以執(zhí)行如權(quán)利要求1-6任一項(xiàng)所述的圖像識(shí)別方法。
9.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括處理器和存儲(chǔ)器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器通過(guò)調(diào)用所述存儲(chǔ)器中存儲(chǔ)的所述計(jì)算機(jī)程序,用于執(zhí)行權(quán)利要求1-6任一項(xiàng)所述的圖像識(shí)別方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,其特征在于,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-6任一項(xiàng)所述的圖像識(shí)別方法。