最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

圖像識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào):41958494發(fā)布日期:2025-05-20 16:52閱讀:3來源:國知局
圖像識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)與流程

本技術(shù)涉及圖像識(shí)別,具體涉及圖像識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。


背景技術(shù):

1、盡管電子支付的覆蓋范圍越來越廣,但考慮到金融系統(tǒng)的獨(dú)立性和網(wǎng)絡(luò)安全風(fēng)險(xiǎn)性企業(yè)等因素,傳統(tǒng)的票據(jù)以及現(xiàn)金仍然在主流支付方式中占有一席之地。這就意味著傳統(tǒng)的票據(jù)以及貨幣等是財(cái)務(wù)人員重點(diǎn)的整理對(duì)象。

2、隨著金融行業(yè)內(nèi)業(yè)務(wù)管理要求的不斷變化,要求財(cái)務(wù)人員將票據(jù)以及現(xiàn)金等金融材料進(jìn)行數(shù)字化整理,實(shí)際業(yè)務(wù)處理過程中常常會(huì)涉及到對(duì)用戶上傳的票據(jù)等金融材料的圖像進(jìn)行分類識(shí)別處理,但考慮到圖像中文字粘連、密集或遮擋等特點(diǎn),往往采用機(jī)人工分類再建檔存儲(chǔ)的方法,效率低下還容易出錯(cuò)。

3、因此,如何提高圖像識(shí)別的效率以及準(zhǔn)確性已成為目前亟需解決的技術(shù)問題。


技術(shù)實(shí)現(xiàn)思路

1、有鑒于此,本技術(shù)提供了一種圖像識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),以解決如何提高圖像識(shí)別的效率以及準(zhǔn)確性的問題。

2、第一方面,本技術(shù)提供了一種圖像識(shí)別方法,該方法包括:

3、獲取待識(shí)別圖像;

4、利用預(yù)先訓(xùn)練得到的圖像分類模型對(duì)待識(shí)別圖像進(jìn)行分類,得到待識(shí)別圖像的分類結(jié)果;

5、從目標(biāo)識(shí)別模型集合中選擇與分類結(jié)果對(duì)應(yīng)的目標(biāo)識(shí)別模型,其中,目標(biāo)識(shí)別模型集合中預(yù)先配置有與不同分類結(jié)果相匹配的目標(biāo)識(shí)別模型;

6、利用目標(biāo)識(shí)別模型,對(duì)待識(shí)別圖像進(jìn)行待識(shí)別區(qū)域定位,并對(duì)待識(shí)別區(qū)域進(jìn)行文本信息識(shí)別,得到待識(shí)別區(qū)域的識(shí)別結(jié)果;

7、將所有待識(shí)別區(qū)域的識(shí)別結(jié)果匯總,確定出待識(shí)別圖像的圖像識(shí)別結(jié)果。

8、上述技術(shù)方案中,可以自動(dòng)對(duì)待識(shí)別圖像進(jìn)行分類,避免人工分類提高了圖像識(shí)別的效率。還可以選擇與待識(shí)別圖像的分類結(jié)果對(duì)應(yīng)的目標(biāo)識(shí)別模型,對(duì)不同類別的待識(shí)別圖像都進(jìn)行待識(shí)別區(qū)域的定位以及信息識(shí)別,進(jìn)而將待識(shí)別圖像的所有待識(shí)別區(qū)域的識(shí)別結(jié)果匯總確定出待識(shí)別圖像的圖像識(shí)別結(jié)果,實(shí)現(xiàn)了對(duì)不同類別圖像的個(gè)性化信息識(shí)別,提高了圖像識(shí)別的準(zhǔn)確性,還避免人工對(duì)圖像的識(shí)別提高了圖像識(shí)別的效率。

9、在一些可選的實(shí)施例中,在對(duì)待識(shí)別區(qū)域進(jìn)行文本信息識(shí)別之后,該方法還包括:

10、利用預(yù)先訓(xùn)練得到的字符識(shí)別模型對(duì)待識(shí)別區(qū)域進(jìn)行目標(biāo)字符的識(shí)別,其中,目標(biāo)字符包括磁性號(hào)碼以及貨幣符號(hào)。

11、具體的,利用字符識(shí)別模型對(duì)待識(shí)別區(qū)域進(jìn)行目標(biāo)字符的識(shí)別對(duì)目標(biāo)識(shí)別模型的識(shí)別結(jié)果進(jìn)行比較以補(bǔ)充與校正,提高了對(duì)票據(jù)圖像的識(shí)別準(zhǔn)確性。

12、在一些可選的實(shí)施例中,在將所有待識(shí)別區(qū)域的識(shí)別結(jié)果匯總,確定出待識(shí)別圖像的圖像識(shí)別結(jié)果之后,該方法還包括:

13、獲取待識(shí)別圖像對(duì)應(yīng)的校正信息;

14、根據(jù)校正信息對(duì)圖像識(shí)別結(jié)果進(jìn)行校正,得到校正后的圖像識(shí)別結(jié)果。

15、具體的,利用校正信息對(duì)圖像識(shí)別結(jié)果進(jìn)行校正,進(jìn)一步提高圖像識(shí)別的準(zhǔn)確性

16、在一些可選的實(shí)施例中,獲取待識(shí)別圖像對(duì)應(yīng)的校正信息,包括:

17、在待識(shí)別圖像中查找信息碼定位標(biāo)識(shí),得到信息碼區(qū)域;

18、對(duì)信息碼區(qū)域中的圖像進(jìn)行數(shù)據(jù)轉(zhuǎn)換,得到信息碼區(qū)域數(shù)據(jù);

19、將目標(biāo)格式信息碼區(qū)域數(shù)據(jù)確定為待識(shí)別圖像對(duì)應(yīng)的校正信息。

20、具體的,基于定位標(biāo)識(shí)定位信息碼區(qū)域以確保識(shí)別到有效的真實(shí)信息提高校正信息的準(zhǔn)確性。

21、在一些可選的實(shí)施例中,在從目標(biāo)識(shí)別模型集合中選擇與分類結(jié)果對(duì)應(yīng)的預(yù)訓(xùn)練的目標(biāo)識(shí)別模型之前,該方法還包括:

22、獲取不同材料的樣本圖像,得到樣本圖像集,樣本圖像標(biāo)注有待識(shí)別區(qū)域內(nèi)文本信息的所屬類別、待識(shí)別區(qū)域的所屬類別以及待識(shí)別區(qū)域的位置信息;

23、根據(jù)樣本圖像集中多張樣本圖像的待識(shí)別區(qū)域內(nèi)文本信息的所屬類別、待識(shí)別區(qū)域的所屬類別以及待識(shí)別區(qū)域的位置信息,對(duì)至少一個(gè)預(yù)構(gòu)建的圖像識(shí)別模型進(jìn)行迭代訓(xùn)練,直至圖像識(shí)別模型的損失函數(shù)滿足訓(xùn)練停止條件,訓(xùn)練完成的圖像識(shí)別模型即為目標(biāo)識(shí)別模型集合中的一個(gè)目標(biāo)識(shí)別模型;

24、損失函數(shù)為基于檢測(cè)目標(biāo)的中心點(diǎn)定位誤差、檢測(cè)目標(biāo)的寬高定位誤差、檢測(cè)目標(biāo)的置信誤差、非檢測(cè)目標(biāo)的置信誤差、檢測(cè)目標(biāo)的分類誤差以及預(yù)設(shè)位置損失權(quán)重,構(gòu)建的函數(shù);

25、在損失函數(shù)中非檢測(cè)目標(biāo)的置信誤差的權(quán)重小于檢測(cè)目標(biāo)的置信誤差的權(quán)重,在損失函數(shù)中預(yù)設(shè)位置損失權(quán)重大于目標(biāo)損失函數(shù)中置信誤差的權(quán)重以及分類誤差的權(quán)重,在損失函數(shù)中檢測(cè)目標(biāo)的寬高定位誤差中的寬度為檢測(cè)目標(biāo)寬度的平方根,檢測(cè)目標(biāo)的寬高定位誤差中的高度為檢測(cè)目標(biāo)高度的平方根。

26、具體的,在訓(xùn)練圖像識(shí)別模型時(shí),使損失函數(shù)中的位置誤差的權(quán)重大于置信誤差以及分類誤差的權(quán)重,保證模型更注重圖像中待識(shí)別區(qū)域的位置,確保待識(shí)別區(qū)域定位的準(zhǔn)確性。而檢測(cè)目標(biāo)的置信誤差大于非檢測(cè)目標(biāo)的置信誤差,有利于抑制非檢測(cè)目標(biāo)的置信度損失,便于圖像識(shí)別模型收斂,加快圖像識(shí)別模型訓(xùn)練速度。以檢測(cè)目標(biāo)寬度以及高度的平方根,代替檢測(cè)目標(biāo)的寬高定位誤差中原本的寬度和高度,可以降低不同大小檢測(cè)目標(biāo)之間的寬高差從而使目標(biāo)損失中不同大小檢測(cè)目標(biāo)的誤差精度與檢測(cè)目標(biāo)的大小相匹配,進(jìn)而提高訓(xùn)練后目標(biāo)識(shí)別模型的精度,提高對(duì)圖像識(shí)別的準(zhǔn)確性。

27、在一些可選的實(shí)施例中,圖像識(shí)別模型包括輸入層、神經(jīng)網(wǎng)絡(luò)層以及輸出層,神經(jīng)網(wǎng)絡(luò)層包括卷積層以及池化層,卷積層包括多個(gè)尺度為3×3的卷積核,以及穿插在3×3的卷積核之間尺度為1×1的卷積核;樣本圖像集中包括訓(xùn)練樣本集和測(cè)試樣本集;

28、輸入層用于將訓(xùn)練樣本集中樣本圖像的尺寸變換為預(yù)設(shè)尺寸,并將尺寸變換后的樣本圖像輸入至神經(jīng)網(wǎng)絡(luò)層;

29、神經(jīng)網(wǎng)絡(luò)層用于利用卷積層以及池化層學(xué)習(xí)尺寸變換后的樣本圖像中待識(shí)別區(qū)域內(nèi)文本信息的所屬類別、待識(shí)別區(qū)域的所屬類別以及待識(shí)別區(qū)域的位置信息,以訓(xùn)練圖像識(shí)別模型中的參數(shù),以及對(duì)卷積層和池化層處理后的數(shù)據(jù)進(jìn)行歸一化以及dropout操作;

30、輸出層用于根據(jù)測(cè)試樣本集確定損失函數(shù)的值。

31、在一些可選的實(shí)施例中,從預(yù)訓(xùn)練的目標(biāo)識(shí)別模型集合中選擇與分類結(jié)果對(duì)應(yīng)的目標(biāo)識(shí)別模型,包括:

32、若分類結(jié)果為票據(jù)圖像,則從目標(biāo)識(shí)別模型集合中分別選擇用于發(fā)票代碼識(shí)別、發(fā)票號(hào)碼識(shí)別、開票日期識(shí)別、校驗(yàn)碼識(shí)別以及金額識(shí)別的目標(biāo)識(shí)別模型;

33、若分類結(jié)果為貨幣圖像,則從目標(biāo)識(shí)別模型集合中分別選擇用于面值識(shí)別、頭像識(shí)別、水印識(shí)別、圖案識(shí)別以及冠字號(hào)識(shí)別的目標(biāo)識(shí)別模型。

34、具體的,針對(duì)不同的分類結(jié)果選擇不同識(shí)別任務(wù)的目標(biāo)識(shí)別模型,以對(duì)待識(shí)別圖像并行的進(jìn)行不同內(nèi)容的識(shí)別,避免一次性識(shí)別多種內(nèi)容降低了識(shí)別的出錯(cuò)率,提高了圖像識(shí)別的準(zhǔn)確性與效率。

35、第二方面,本技術(shù)提供了一種圖像識(shí)別裝置,該裝置包括:

36、第一獲取模塊,用于獲取待識(shí)別圖像;

37、分類模塊,用于利用預(yù)先訓(xùn)練得到的圖像分類模型對(duì)待識(shí)別圖像進(jìn)行分類,得到待識(shí)別圖像的分類結(jié)果;

38、選擇模塊,用于從目標(biāo)識(shí)別模型集合中選擇與分類結(jié)果對(duì)應(yīng)的目標(biāo)識(shí)別模型,其中,目標(biāo)識(shí)別模型集合中預(yù)先配置有與不同分類結(jié)果相匹配的目標(biāo)識(shí)別模型;

39、定位識(shí)別模塊,用于利用目標(biāo)識(shí)別模型,對(duì)待識(shí)別圖像進(jìn)行待識(shí)別區(qū)域定位,并對(duì)待識(shí)別區(qū)域進(jìn)行文本信息識(shí)別,得到待識(shí)別區(qū)域的識(shí)別結(jié)果;

40、匯總模塊,用于將所有待識(shí)別區(qū)域的識(shí)別結(jié)果匯總,確定出待識(shí)別圖像的圖像識(shí)別結(jié)果。

41、第三方面,本技術(shù)提供了一種計(jì)算機(jī)設(shè)備,包括:存儲(chǔ)器和處理器,存儲(chǔ)器和處理器之間互相通信連接,存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)指令,處理器通過執(zhí)行計(jì)算機(jī)指令,從而執(zhí)行上述第一方面的任一圖像識(shí)別方法。

42、第四方面,本技術(shù)提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行上述第一方面的任一圖像識(shí)別方法。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1