專利名稱:一種證書(shū)證件文字識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種證書(shū)證件文字識(shí)別方法。
背景技術(shù):
隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,光學(xué)字符識(shí)別技術(shù)得到了廣泛的應(yīng)用,光學(xué)字符識(shí)別簡(jiǎn)稱OCR,是Optical Character Recognition的簡(jiǎn)稱,尤其是對(duì)各類證件文字的識(shí)別, 得到了很好的應(yīng)用,但是目前對(duì)現(xiàn)有的特定類別的證書(shū)證件的特定區(qū)域的識(shí)別處理技術(shù)必須事先經(jīng)過(guò)學(xué)習(xí)并特定地加以規(guī)范而提出的預(yù)定義才能進(jìn)行識(shí)別,因此,目前市面上的都是對(duì)特定的證書(shū)證件的OCR識(shí)別軟件與模塊,例如對(duì)一代身份證件的圖像經(jīng)過(guò)掃描后進(jìn)行 OCR識(shí)別,對(duì)駕駛證的掃描圖像的OCR識(shí)別等,但是這些特定的識(shí)別均存在一個(gè)問(wèn)題,那就是他們無(wú)法應(yīng)用于別的證書(shū)證件的識(shí)別,同時(shí)對(duì)于未來(lái)未知的證書(shū)證件的識(shí)別更是無(wú)法適應(yīng)。
發(fā)明內(nèi)容
本發(fā)明的目的是為研制一種解決上述問(wèn)題,采用在實(shí)際應(yīng)用過(guò)程中對(duì)新增的證書(shū)證件的樣式通過(guò)預(yù)定義的方式,并存上其需要識(shí)別的區(qū)域與格式,然后在實(shí)際的應(yīng)用時(shí),只需將合符要求的證書(shū)證件的掃描或者照拍圖像告之系統(tǒng),系統(tǒng)即可通過(guò)預(yù)先定義的樣式, 對(duì)特定的區(qū)域進(jìn)行OCR識(shí)別,并將結(jié)果以規(guī)定的格式返回給調(diào)用者的證書(shū)證件文字識(shí)別方法。本發(fā)明通過(guò)以下技術(shù)方案實(shí)現(xiàn)本發(fā)明是以中間件的方式提供給調(diào)用者,供調(diào)用者調(diào)用。本發(fā)明是一種基于圖像的OCR識(shí)別與處理方法。首先定義圖像的特定區(qū)域,圖像的特定區(qū)域是通過(guò)調(diào)用者在實(shí)際使用過(guò)程中,對(duì)該種類的的圖像建議特定的圖像樣式文件,并將其需要識(shí)別的特定區(qū)域按相應(yīng)的分析與處理模式存儲(chǔ)在在其圖像樣式文件中,一個(gè)圖像樣式文件中可以存儲(chǔ)該類圖像的多個(gè)識(shí)別區(qū)域,多個(gè)識(shí)別區(qū)域包括起止位置、文字的屬性(類型{數(shù)字、日期、字符等}、字體、字號(hào)、字型、格式、長(zhǎng)度、校驗(yàn)碼)等。其次,調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,查找圖像樣式文件,找到圖像樣式文件,從其圖像對(duì)應(yīng)圖像樣式文件中讀取其需要識(shí)別的特定區(qū)域,然后按其特定的需要識(shí)別與處理的區(qū)域進(jìn)行識(shí)別,并將結(jié)果返回給調(diào)用者即可。調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,找不到圖像樣式文件,又不定義圖像樣式文件時(shí),則視為全文識(shí)別,然后按其特定的需要識(shí)別與處理的區(qū)域進(jìn)行識(shí)別,并將結(jié)果返回給調(diào)用者即可。調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,找不到圖像樣式文件,定義圖像樣式文件時(shí),調(diào)用者定義需要識(shí)別的區(qū)域,存儲(chǔ)需要識(shí)別的區(qū)域到圖像樣式文件中,定義圖像樣式文件,并命名,達(dá)到設(shè)計(jì)目的。
經(jīng)由本發(fā)明的實(shí)施,適用于各類證書(shū)證件文字識(shí)別。
圖1是本發(fā)明的方法步驟示意圖。
具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明進(jìn)一步的介紹,但不作為本發(fā)明的限定。首先定義圖像的特定區(qū)域,圖像的特定區(qū)域是通過(guò)調(diào)用者在實(shí)際使用過(guò)程中,對(duì)該種類的的圖像建議特定的圖像樣式文件,并將其需要識(shí)別的特定區(qū)域按相應(yīng)的分析與處理模式存儲(chǔ)在在其圖像樣式文件中,一個(gè)圖像樣式文件中可以存儲(chǔ)該類圖像的多個(gè)識(shí)別區(qū)域,多個(gè)識(shí)別區(qū)域包括起止位置、文字的屬性(類型{數(shù)字、日期、字符等}、字體、字號(hào)、字型、格式、長(zhǎng)度、校驗(yàn)碼)等。其次,調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,查找圖像樣式文件,找到圖像樣式文件,從其圖像對(duì)應(yīng)圖像樣式文件中讀取其需要識(shí)別的特定區(qū)域,然后按其特定的需要識(shí)別與處理的區(qū)域進(jìn)行識(shí)別,并將結(jié)果返回給調(diào)用者即可。調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,找不到圖像樣式文件,又不定義圖像樣式文件時(shí),則視為全文識(shí)別,然后按其特定的需要識(shí)別與處理的區(qū)域進(jìn)行識(shí)別,并將結(jié)果返回給調(diào)用者即可。調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,找不到圖像樣式文件,定義圖像樣式文件時(shí),調(diào)用者定義需要識(shí)別的區(qū)域,存儲(chǔ)需要識(shí)別的區(qū)域到圖像樣式文件中,定義圖像樣式文件,并命名,達(dá)到設(shè)計(jì)目的。本發(fā)明是以中間件的方式提供給調(diào)用者,供調(diào)用者調(diào)用,適用于各類證書(shū)證件文字識(shí)別。
權(quán)利要求
1. 一種證書(shū)證件文字識(shí)別方法,其特征在于首先定義圖像的特定區(qū)域,圖像的特定區(qū)域是通過(guò)調(diào)用者在實(shí)際使用過(guò)程中,對(duì)該種類的圖像建立特定的圖像樣式文件,并將其需要識(shí)別的特定區(qū)域按相應(yīng)的分析與處理模式存儲(chǔ)在在其圖像樣式文件中,一個(gè)圖像樣式文件中可以存儲(chǔ)該類圖像的多個(gè)識(shí)別區(qū)域,多個(gè)識(shí)別區(qū)域包括起止位置、文字的屬性(類型{數(shù)字、日期、字符等}、字體、字號(hào)、字型、格式、長(zhǎng)度、校驗(yàn)碼)等。其次,調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,查找圖像樣式文件,找到對(duì)應(yīng)的圖像樣式文件,從其圖像對(duì)應(yīng)圖像樣式文件中讀取其需要識(shí)別的特定區(qū)域,然后按其特定的需要識(shí)別與處理的區(qū)域進(jìn)行識(shí)別,并將結(jié)果返回給調(diào)用者。調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,找不到圖像樣式文件,又不定義圖像樣式文件時(shí),則視為全文識(shí)別,然后按其特定的需要識(shí)別與處理的區(qū)域進(jìn)行識(shí)別,并將結(jié)果返回給調(diào)用者即可。調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,找不到圖像樣式文件,定義圖像樣式文件時(shí),調(diào)用者定義需要識(shí)別的區(qū)域,存儲(chǔ)需要識(shí)別的區(qū)域到圖像樣式文件中,定義圖像樣式文件,并命名。
全文摘要
本發(fā)明涉及一種證書(shū)證件文字識(shí)別方法,其特征在于首先定義圖像的特定區(qū)域,其次,調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,查找圖像樣式文件,找到圖像樣式文件,從其圖像對(duì)應(yīng)圖像樣式文件中讀取其需要識(shí)別的特定區(qū)域,然后按其特定的需要識(shí)別與處理的區(qū)域進(jìn)行識(shí)別,并將結(jié)果返回給調(diào)用者即可,找不到圖像樣式文件,又不定義圖像樣式文件時(shí),則視為全文識(shí)別,然后按其特定的需要識(shí)別與處理的區(qū)域進(jìn)行識(shí)別,并將結(jié)果返回給調(diào)用者即可,調(diào)用者打開(kāi)中間件,對(duì)需要識(shí)別的圖像進(jìn)行識(shí)別,找不到圖像樣式文件,定義圖像樣式文件時(shí),調(diào)用者定義需要識(shí)別的區(qū)域,存儲(chǔ)需要識(shí)別的區(qū)域到圖像樣式文件中,定義圖像樣式文件,并命名,達(dá)成到設(shè)計(jì)目的。
文檔編號(hào)G06K9/00GK102236782SQ20101016025
公開(kāi)日2011年11月9日 申請(qǐng)日期2010年4月30日 優(yōu)先權(quán)日2010年4月30日
發(fā)明者陳斌, 陶懿 申請(qǐng)人:陳斌