最新的毛片基地免费,国产国语一级毛片,免费国产成人高清在线电影,中天堂国产日韩欧美,中国国产aa一级毛片,国产va欧美va在线观看,成人不卡在线

票據(jù)錯(cuò)位字符識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào):41944497發(fā)布日期:2025-05-16 14:01閱讀:1來(lái)源:國(guó)知局
票據(jù)錯(cuò)位字符識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

本發(fā)明涉及圖像處理,尤其涉及一種票據(jù)錯(cuò)位字符識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。


背景技術(shù):

1、傳統(tǒng)的光學(xué)字符識(shí)別(以下簡(jiǎn)稱(chēng)ocr)技術(shù),屬于單一視覺(jué)模態(tài)處理技術(shù)(以下簡(jiǎn)稱(chēng)單模態(tài)技術(shù)),包含文字檢測(cè)模塊和文字識(shí)別模塊。文字檢測(cè)模塊用于定位文本區(qū)域,該區(qū)域以行文本為單位進(jìn)行輸出。輸出坐標(biāo)為四邊形框,坐標(biāo)采用橫縱坐標(biāo)系方式表示,以整圖的左上角為原點(diǎn),右下角為(圖像的寬,圖像的高),常見(jiàn)的四邊形框采用四個(gè)頂點(diǎn)進(jìn)行輸出。文字識(shí)別模塊用于識(shí)別文本區(qū)域內(nèi)的文本,該文本以字符為單位進(jìn)行輸出。

2、對(duì)于標(biāo)準(zhǔn)的票據(jù)識(shí)別而言,ocr技術(shù)可以輸出票據(jù)影像的每個(gè)行文本的內(nèi)容,且按自然語(yǔ)言處理技術(shù)(如常見(jiàn)的正則表達(dá)式方法)進(jìn)行提取要素信息,以標(biāo)準(zhǔn)的鍵值對(duì)的結(jié)構(gòu)化方式輸出。但是在金融票據(jù)(如支票、匯票、結(jié)算業(yè)務(wù)委托書(shū)、進(jìn)賬單)會(huì)有基礎(chǔ)模板和內(nèi)容二次打印的情況,也容易產(chǎn)生賬號(hào)文本內(nèi)容與格子錯(cuò)位或者重疊的情況,使用ocr技術(shù)進(jìn)行識(shí)別,雖然能提升整體錄入效率,但因超格導(dǎo)致漏錄入賬號(hào)字符內(nèi)容,而造成的業(yè)務(wù)流程上的差錯(cuò)。

3、因此,亟需一種票據(jù)錯(cuò)位字符識(shí)別方法,能夠有效提高金融票據(jù)錯(cuò)位內(nèi)容識(shí)別的準(zhǔn)確率。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的主要目的在于提供了一種票據(jù)錯(cuò)位字符識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),旨在解決現(xiàn)有技術(shù)中金融票據(jù)錯(cuò)位內(nèi)容識(shí)別的準(zhǔn)確率較低的技術(shù)問(wèn)題。

2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種票據(jù)錯(cuò)位字符識(shí)別方法,所述方法包括以下步驟:

3、獲取票據(jù)圖像,并根據(jù)字段相對(duì)區(qū)域參數(shù)配置文件對(duì)所述票據(jù)圖像進(jìn)行區(qū)域切割,獲得多個(gè)字段切片圖;

4、基于字段易錯(cuò)狀態(tài)配置文件,判斷所述字段切片圖是否屬于易錯(cuò)位區(qū)域;

5、若所述字段切片圖屬于易錯(cuò)位區(qū)域,則分別通過(guò)端到端圖像理解技術(shù)和ocr技術(shù)對(duì)所述字段切片圖進(jìn)行處理,獲得第一預(yù)測(cè)結(jié)果和第二預(yù)測(cè)結(jié)果;

6、對(duì)所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果進(jìn)行相似度對(duì)比,并基于相似度對(duì)比結(jié)果確定識(shí)別結(jié)果。

7、可選地,所述基于字段易錯(cuò)狀態(tài)配置文件,判斷所述字段切片圖是否屬于易錯(cuò)位區(qū)域的步驟之后,還包括:

8、若所述字段切片圖不屬于易錯(cuò)位區(qū)域,則通過(guò)ocr技術(shù)提取所述字段切片圖的文字位置信息和文字內(nèi)容信息;

9、利用正則表達(dá)式對(duì)所述文字位置信息和所述文字內(nèi)容信息進(jìn)行信息提取,獲得識(shí)別結(jié)果。

10、可選地,所述獲取票據(jù)圖像,并根據(jù)字段相對(duì)區(qū)域參數(shù)配置文件對(duì)所述票據(jù)圖像進(jìn)行區(qū)域切割,獲得多個(gè)字段切片圖的步驟,包括:

11、利用高拍儀設(shè)備對(duì)票據(jù)進(jìn)行影像化,獲得票據(jù)圖像;

12、根據(jù)字段相對(duì)區(qū)域參數(shù)配置文件確定所述票據(jù)中各字段對(duì)應(yīng)的相對(duì)區(qū)域坐標(biāo)信息;

13、基于所述票據(jù)中各字段對(duì)應(yīng)的相對(duì)區(qū)域坐標(biāo)信息對(duì)所述票據(jù)圖像進(jìn)行區(qū)域切割,獲得多個(gè)字段切片圖。

14、可選地,所述若所述字段切片圖屬于易錯(cuò)位區(qū)域,則分別通過(guò)端到端圖像理解技術(shù)和ocr技術(shù)對(duì)所述字段切片圖進(jìn)行處理,獲得第一預(yù)測(cè)結(jié)果和第二預(yù)測(cè)結(jié)果的步驟,包括:

15、若所述字段切片圖屬于易錯(cuò)位區(qū)域,則確定所述字段切片圖對(duì)應(yīng)的字段,并將所述字段切片圖對(duì)應(yīng)的字段名稱(chēng)作為提示詞;

16、基于所述字段切片圖和所述提示詞,利用端到端圖像理解技術(shù),獲得所述字段切片圖對(duì)應(yīng)的第一預(yù)測(cè)結(jié)果;

17、基于所述字段切片圖,利用ocr技術(shù),獲得所述字段切片圖的文本信息;

18、利用正則表達(dá)式對(duì)所述文本信息進(jìn)行信息提取,獲得所述字段切片圖對(duì)應(yīng)的第二預(yù)測(cè)結(jié)果。

19、可選地,所述對(duì)所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果進(jìn)行相似度對(duì)比,并基于相似度對(duì)比結(jié)果確定識(shí)別結(jié)果的步驟,包括:

20、按照字符維度對(duì)所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果進(jìn)行相似度對(duì)比,獲得相似度對(duì)比結(jié)果;

21、若所述相似度對(duì)比結(jié)果表示所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果的相似度不為1,則將所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果與語(yǔ)料庫(kù)進(jìn)行匹配,獲得匹配結(jié)果;

22、在所述匹配結(jié)果表示所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果與所述語(yǔ)料庫(kù)中語(yǔ)料的匹配度為1時(shí),確定所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果的相似度;

23、將所述相似度以及所述第一預(yù)測(cè)結(jié)果或所述第二預(yù)測(cè)結(jié)果作為識(shí)別結(jié)果。

24、可選地,所述將所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果與語(yǔ)料庫(kù)進(jìn)行匹配,獲得匹配結(jié)果的步驟之后,還包括:

25、在所述匹配結(jié)果表示所述第一預(yù)測(cè)結(jié)果與所述語(yǔ)料庫(kù)中語(yǔ)料的匹配度為1且所述第二預(yù)測(cè)結(jié)果與所述語(yǔ)料庫(kù)中語(yǔ)料的匹配度不為1時(shí),則確定所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果的相似度,并將所述相似度和所述第一預(yù)測(cè)結(jié)果作為識(shí)別結(jié)果;

26、在所述匹配結(jié)果表示所述第二預(yù)測(cè)結(jié)果與所述語(yǔ)料庫(kù)中語(yǔ)料的匹配度為1且所述第一預(yù)測(cè)結(jié)果與所述語(yǔ)料庫(kù)中語(yǔ)料的匹配度不為1時(shí),則確定所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果的相似度,并將所述相似度和所述第二預(yù)測(cè)結(jié)果作為識(shí)別結(jié)果;

27、在所述匹配結(jié)果表示所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果與所述語(yǔ)料庫(kù)中語(yǔ)料的匹配度不為1時(shí),則確定所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果的相似度,并將所述相似度和空值作為識(shí)別結(jié)果。

28、可選地,所述對(duì)所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果進(jìn)行相似度對(duì)比,并基于相似度對(duì)比結(jié)果確定識(shí)別結(jié)果的步驟之后,還包括:

29、基于所述識(shí)別結(jié)果進(jìn)行審核和修正,獲得處理后的識(shí)別結(jié)果;

30、將所述處理后的識(shí)別結(jié)果回流到語(yǔ)料庫(kù),獲得更新后的語(yǔ)料庫(kù)。

31、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種票據(jù)錯(cuò)位字符識(shí)別裝置,所述裝置包括:

32、區(qū)域切割模塊,用于獲取票據(jù)圖像,并根據(jù)字段相對(duì)區(qū)域參數(shù)配置文件對(duì)所述票據(jù)圖像進(jìn)行區(qū)域切割,獲得多個(gè)字段切片圖;

33、區(qū)域判斷模塊,用于基于字段易錯(cuò)狀態(tài)配置文件,判斷所述字段切片圖是否屬于易錯(cuò)位區(qū)域;

34、預(yù)測(cè)輸出模塊,用于若所述字段切片圖屬于易錯(cuò)位區(qū)域,則分別通過(guò)端到端圖像理解技術(shù)和ocr技術(shù)對(duì)所述字段切片圖進(jìn)行處理,獲得第一預(yù)測(cè)結(jié)果和第二預(yù)測(cè)結(jié)果;

35、結(jié)果輸出模塊,用于對(duì)所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果進(jìn)行相似度對(duì)比,并基于相似度對(duì)比結(jié)果確定識(shí)別結(jié)果。

36、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種票據(jù)錯(cuò)位字符識(shí)別設(shè)備,所述設(shè)備包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的票據(jù)錯(cuò)位字符識(shí)別程序,所述票據(jù)錯(cuò)位字符識(shí)別程序配置為實(shí)現(xiàn)如上文所述的票據(jù)錯(cuò)位字符識(shí)別方法的步驟。

37、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有票據(jù)錯(cuò)位字符識(shí)別程序,所述票據(jù)錯(cuò)位字符識(shí)別程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文所述的票據(jù)錯(cuò)位字符識(shí)別方法的步驟。

38、本發(fā)明公開(kāi)了獲取票據(jù)圖像,并根據(jù)字段相對(duì)區(qū)域參數(shù)配置文件對(duì)所述票據(jù)圖像進(jìn)行區(qū)域切割,獲得多個(gè)字段切片圖;基于字段易錯(cuò)狀態(tài)配置文件,判斷所述字段切片圖是否屬于易錯(cuò)位區(qū)域;若所述字段切片圖屬于易錯(cuò)位區(qū)域,則分別通過(guò)端到端圖像理解技術(shù)和ocr技術(shù)對(duì)所述字段切片圖進(jìn)行處理,獲得第一預(yù)測(cè)結(jié)果和第二預(yù)測(cè)結(jié)果;對(duì)所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果進(jìn)行相似度對(duì)比,并基于相似度對(duì)比結(jié)果確定識(shí)別結(jié)果。由于本發(fā)明根據(jù)字段相對(duì)區(qū)域參數(shù)配置文件對(duì)票據(jù)圖像進(jìn)行區(qū)域切割,并在字段切片圖屬于易錯(cuò)位區(qū)域時(shí)分別基于端到端圖像理解技術(shù)和ocr技術(shù),獲得第一預(yù)測(cè)結(jié)果和第二預(yù)測(cè)結(jié)果,然后基于第一預(yù)測(cè)結(jié)果和第二預(yù)測(cè)結(jié)果的相似度對(duì)比結(jié)果確定識(shí)別結(jié)果,相比于現(xiàn)有技術(shù),本發(fā)明有效提高了金融票據(jù)錯(cuò)位內(nèi)容識(shí)別的準(zhǔn)確率。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1