專利名稱:一種文檔傾斜檢測(cè)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于檢測(cè)技術(shù)領(lǐng)域,具體涉及一種文檔傾斜檢測(cè)方法及系統(tǒng)。
背景技術(shù):
文檔圖像傾斜是文檔掃描過(guò)程中的一種無(wú)法避免的現(xiàn)象。如果不進(jìn)行傾斜校正, 會(huì)影響后續(xù)的版面分析、OCR和版面理解的準(zhǔn)確度。文檔的傾斜檢測(cè)的專利和論文也比較多,有投影類的方法、依賴Hough變換的方法、傅里葉變換的方法、最近鄰的方法等等。但是目前這些方法都存在著一定的問(wèn)題。投影類的方法是基于對(duì)投影圖像形狀分析的方法,基本思想是計(jì)算一系列角度的投影形狀,并定義一個(gè)目標(biāo)函數(shù),實(shí)際的傾斜角度就是使目標(biāo)函數(shù)最優(yōu)的值。這類方法需要計(jì)算每個(gè)傾斜角度的投影形狀,如果要得到高精度的估計(jì),計(jì)算量將會(huì)大增,且較容易受到噪聲和分欄的影響。投影類的方法一般計(jì)算量較大,且精度較差,無(wú)法處理分欄、插圖等復(fù)雜版面,最適合的是曼哈頓類版面。Hough變換的方法或者是利用文檔圖像內(nèi)的邊緣,或者利用行基線,很受圖像內(nèi)容的影響。例如,沒(méi)有直線的時(shí)候?qū)o(wú)法處理,多用于特定類型的文檔。利用連通域中心的方法只是在變換空間尋找最大值點(diǎn),對(duì)于文字稀疏、干擾較大、無(wú)法知道排版類型的圖像,準(zhǔn)確率下降或無(wú)法檢測(cè)??捎糜贖ough變換計(jì)算的特征有字塊重心,空白塊重心,字行基線, 每行的最左或最右點(diǎn),已劃分好的子區(qū)域的邊緣等等。主要通過(guò)尋找Hough變化空間極值點(diǎn)來(lái)確定角度,字符很少時(shí)易受干擾。傅里葉變換的方法,由于文檔圖像中的字符行是周期性出現(xiàn)的,所以有文獻(xiàn)指出可以利用傅里葉變換分析傾斜角度,在頻域空間中密度最大的方向角度就是傾斜角度。這一方法對(duì)于大圖計(jì)算較耗時(shí)。最近鄰的方法,首先找出所有聯(lián)通區(qū)域,然后根據(jù)歐式距離確定每個(gè)連通渠的最近鄰,并計(jì)算最近鄰連通區(qū)中心點(diǎn)的方向。對(duì)所有最近鄰對(duì)的方向向量進(jìn)行累積,直方圖的中的峰值點(diǎn)就對(duì)應(yīng)傾斜角度。由于每個(gè)最近鄰的只計(jì)算連接一個(gè)區(qū)域,字符的子塊會(huì)降低準(zhǔn)確度。且受版面類型影響太大。對(duì)于不同版式的適應(yīng)性差。利用頁(yè)眉頁(yè)腳線、分欄線等方法過(guò)于依賴文檔圖像內(nèi)容,也造成了適用性差。文檔傾斜檢測(cè)也具體如下一些專利或?qū)@暾?qǐng)(I)Skew detection(US7277600B2)該專利利用計(jì)算原文檔圖像的游程平滑(run-length-smoothed image (RLSA)圖像來(lái)估計(jì)傾斜角度。需要排版方向信息,易受嵌入插圖的影響。(2)Document image skew detection method(US6771842B1)該專利利用行間距先分割出字行(Text Line),然后利用字行估計(jì)傾斜角度。(3)Method and System for Skew Detection of A Scanned Document Using Connected Components Analysis (US2010195933A1)該專利利用二值圖的連通域,自底向上形成字行,然后估計(jì)傾斜角度。
(4)Image Skew Detection Apparatus And Methods(US2009252437A1)該專利提供了一種通過(guò)檢測(cè)直線的方式進(jìn)行支票類圖像的傾斜檢測(cè)。(5) 一種證件圖像傾斜校正的方法(申請(qǐng)?zhí)?00910041444. 9)該專利對(duì)圖像利用Sobel算子檢測(cè)邊緣,對(duì)邊緣圖像進(jìn)行Hough變換檢測(cè)傾斜角度,適用于證件圖像。(6)圖像傾斜校正方法及裝置(申請(qǐng)?zhí)?01010221775. 3)該專利利用二值圖像的投影長(zhǎng)度與設(shè)定閾值進(jìn)行比較以確定是否存在傾斜,然后在灰度圖中獲取邊緣信息,利用邊緣角度估計(jì)傾斜角度。用于車牌圖像的傾斜檢測(cè)。由于在圖書(shū)加工的生產(chǎn)中會(huì)遇到各種各樣的版面類型,這就要求開(kāi)發(fā)一種適應(yīng)性、效率和精度都比較高的文檔傾斜校正方法。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種適應(yīng)性強(qiáng)、 精度高、速度快的文檔傾斜檢測(cè)方法及系統(tǒng)。為解決上述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案如下一種文檔傾斜檢測(cè)方法,包括以下步驟(1)對(duì)文檔圖像進(jìn)行二值化處理,得到二值文檔圖像;(2)計(jì)算二值文檔圖像中的連通域、所述連通域的外接矩形以及所述外接矩形的中心點(diǎn)坐標(biāo);(3)將所述連通域最小外接矩形的中心作為Hough變換計(jì)算的輸入點(diǎn)集,在Hough 變換參數(shù)空間投票,計(jì)算累加矩陣Α( θ,ρ);(4)檢測(cè)所述累加矩陣參數(shù)空間的極大值點(diǎn);(5)將角度值上極大值點(diǎn)的累積值向角度坐標(biāo)軸上投影,形成一維數(shù)據(jù)Ρ( θ );(6)在所述一維數(shù)據(jù)Ρ( θ )中,檢測(cè)間隔90°的累加最大的峰對(duì),由最大峰對(duì)所在角度判斷出傾斜角度,得到文檔傾斜角度。如上所述的文檔傾斜檢測(cè)方法,優(yōu)選的,在步驟(1)之前還包括對(duì)文檔圖像進(jìn)行預(yù)處理的步驟。所述預(yù)處理包括對(duì)所述文檔圖像進(jìn)行降噪處理。如上所述的文檔傾斜檢測(cè)方法,優(yōu)選的,在步驟(2)和步驟(3)之間還包括按照掃描的DPI信息篩除過(guò)小連通域的步驟。在300DPI下,過(guò)小連通域的閾值為100。如上所述的文檔傾斜檢測(cè)方法,優(yōu)選的,在步驟(4)和步驟( 之間還包括如下步驟在每一個(gè)角度值上,對(duì)徑向方向上的所有點(diǎn)做周期性分析,選擇出具有一定周期性的角度值。一種文檔傾斜檢測(cè)系統(tǒng),包括用于對(duì)文檔圖像進(jìn)行二值化處理,得到二值文檔圖像的二值化處理裝置;用于計(jì)算二值圖像中的連通域、連通域的外接矩形以及外接矩形中心點(diǎn)坐標(biāo)的第
一計(jì)算裝置;用于將所述連通域最小外接矩形的中心作為Hough變換計(jì)算的輸入點(diǎn)集,在 Hough變換參數(shù)空間投票,計(jì)算累加矩陣Α( θ,ρ)的第二計(jì)算裝置;用于檢測(cè)累加矩陣參數(shù)空間極大值點(diǎn)的檢測(cè)裝置;
用于將角度值上極大值點(diǎn)的累積值向角度坐標(biāo)軸上投影,形成一維數(shù)據(jù)Ρ( θ )的投影裝置;用于在一維數(shù)據(jù)Ρ( θ )中,檢測(cè)間隔90°的累加最大的峰對(duì),由最大峰對(duì)所在角度判斷出傾斜角度的判斷裝置。如上所述的文檔傾斜檢測(cè)系統(tǒng),優(yōu)選的,還包括用于對(duì)文檔圖像進(jìn)行預(yù)處理的預(yù)
處理裝置。如上所述的文檔傾斜檢測(cè)系統(tǒng),優(yōu)選的,還包括用于按照掃描的DPI信息篩除過(guò)小連通域的篩除裝置。如上所述的文檔傾斜檢測(cè)系統(tǒng),優(yōu)選的,還包括用于在每一個(gè)角度值上,對(duì)徑向方向上的所有點(diǎn)做周期性分析,選擇出具有一定周期性的角度值的分析裝置。本發(fā)明所述方法及系統(tǒng),不受排版方向、混合排版、版面結(jié)構(gòu)、分欄、插圖等影響, 適應(yīng)性較強(qiáng),適合于包含文字的文檔圖像,除了普通圖書(shū),還適合雜志、帶文字的表格、版面復(fù)雜的報(bào)紙、帶公式的科技論文、車牌圖像、名片、各類表單等。而且,有兩方向上的峰值檢測(cè)保證,降低了其他方向上的峰值干擾,精度較高(0. 1度),計(jì)算速度較快。
圖1是具體實(shí)施方式
中文檔傾斜檢測(cè)系統(tǒng)的結(jié)構(gòu)框圖;圖2是具體實(shí)施方式
中文檔傾斜檢測(cè)方法的流程圖;圖3是具體實(shí)施方式
中Hough變換示意圖,圖3a表示直線余弦公式參數(shù)的示意圖,圖北表示圖像空間的三條直線的示意圖,圖3c表示變換空間對(duì)應(yīng)三個(gè)點(diǎn)的示意圖;圖4是具體實(shí)施方式
中傾斜文檔的示意圖;圖5是具體實(shí)施方式
中圖4所示傾斜的文檔計(jì)算所有連通域后的效果示意圖;圖6是具體實(shí)施方式
中圖4所示傾斜的文檔累積矩陣90度附近截圖;圖7是具體實(shí)施方式
中圖4所示傾斜的文檔累積矩陣極值點(diǎn)90度附近局部放大截圖;圖8是具體實(shí)施方式
中圖4所示傾斜的文檔周期極值點(diǎn)90度附近截圖;圖9是具體實(shí)施方式
中圖4所示傾斜的文檔投影曲線示意圖。
具體實(shí)施例方式本發(fā)明的基本思想是利用文字的直線排列特征進(jìn)行直線檢測(cè),不論是橫排版還是豎排版,文字的連通區(qū)域的中心是一條條平行的直線。直線檢測(cè)方法多用Hough變換,但是如果僅僅在Hough變換空間檢測(cè)最大值點(diǎn),會(huì)損失許多有用信息,而這些信息的利用可以提高方法的精度和適用性。下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方式
進(jìn)行詳細(xì)描述。如圖1所示,本實(shí)施方式中文檔傾斜檢測(cè)系統(tǒng)包括預(yù)處理裝置10、二值化處理裝置11、第一計(jì)算裝置12、篩除裝置13、第二計(jì)算裝置14、檢測(cè)裝置15、分析裝置16、投影裝置17和判斷裝置18。預(yù)處理裝置10用于對(duì)文檔圖像進(jìn)行預(yù)處理,如灰度調(diào)整、降噪等。二值化處理裝置11用于對(duì)文檔圖像進(jìn)行二值化處理,得到二值文檔圖像。第一計(jì)算裝置12用于根據(jù)二值圖像計(jì)算連通域,連通域的外接矩形以及外接矩形中心點(diǎn)坐標(biāo)。篩除裝置13用于按照掃描的DPI信息篩除過(guò)小的連通域。第二計(jì)算裝置14用于將連通域最小外接矩形的中心作為Hough變換計(jì)算的輸入點(diǎn)集,在Hough變換參數(shù)空間投票,計(jì)算累加矩陣Α(θ,ρ)。檢測(cè)裝置15用于檢測(cè)參數(shù)空間的極大值點(diǎn)。分析裝置16用于在每一個(gè)角度值上,對(duì)徑向方向上的所有點(diǎn)做周期性分析,選擇出具有一定周期性的角度值。投影裝置17用于將角度值上極大值點(diǎn)的累積值向角度坐標(biāo)軸上投影,形成一維數(shù)據(jù)Ρ( θ )。判斷裝置18用于在一維數(shù)據(jù)Ρ(θ)中,檢測(cè)間隔90°的累加最大的峰對(duì),由最大峰對(duì)所在角度判斷出傾斜角度。如圖2所示,采用圖1所示系統(tǒng)實(shí)現(xiàn)文檔傾斜檢測(cè)的方法包括以下步驟(1)預(yù)處理裝置10對(duì)文檔圖像進(jìn)行預(yù)處理,得到預(yù)處理后的文檔圖像。預(yù)處理包括對(duì)文檔圖像進(jìn)行灰度調(diào)整、降噪等,預(yù)處理的目的是更好的得到二值圖像。有些掃描圖像噪聲較大,可以利用降噪的方法去除噪聲,降噪方法可選圖像處理領(lǐng)域的Bilateral濾波器濾波。(2) 二值化處理裝置11對(duì)預(yù)處理后的文檔圖像進(jìn)行二值化處理,得到二值文檔圖像。對(duì)圖像進(jìn)行二值化處理是圖像處理領(lǐng)域中的常用技術(shù),此處不再贅述。(3)第一計(jì)算裝置12計(jì)算二值文檔圖像中的連通域,連通域的外接矩形以及外接矩形的中心點(diǎn)坐標(biāo)。連通域查找技術(shù)是圖像處理領(lǐng)域中的常用技術(shù)。例如,在二值文檔圖像中,如果要查找代表文字的黑像素,可以以一個(gè)黑像素點(diǎn)為開(kāi)始,搜尋其周圍8鄰域的像素點(diǎn),如果鄰域上的像素點(diǎn)也為黑像素點(diǎn)則認(rèn)為它們是一個(gè)連通域內(nèi)的像素點(diǎn),然后依次再計(jì)算鄰域上黑像素點(diǎn)的鄰域,最終找出一片相連的黑像素點(diǎn)區(qū)域,這個(gè)就是一個(gè)連通域。查找圖像中其他沒(méi)有計(jì)算過(guò)的位置,重復(fù)上述步驟,即可找出所有的連通域。圖4所示傾斜的文檔,計(jì)算所有連通域后的效果如圖5所示。對(duì)于每個(gè)連通域,其中每個(gè)像素點(diǎn)的X,y坐標(biāo),在一個(gè)連通域中所有的像素點(diǎn)計(jì)算最小和最大的x,y,即可得到該連通域的上下左右的邊界坐標(biāo),即計(jì)算出了最小的外接矩形四個(gè)頂點(diǎn),坐標(biāo)分另1J為(xmin, ymin)、(xmin, ymax)、(xmax, ymin)、(xmax, ymax)。(4)篩除裝置13按照掃描的DPI信息篩除過(guò)小的連通域。優(yōu)選的,先篩除過(guò)小的連通域,這樣可以進(jìn)一步提高精度和適用性。根據(jù)上一步中計(jì)算得到的連通域,可以知道每個(gè)連通域中黑像素點(diǎn)的數(shù)量,將黑像素點(diǎn)的數(shù)量定義為連通域的大小。較小的連通域可能是噪聲或其他非文字結(jié)構(gòu)。篩除較小的連通域有利于提高準(zhǔn)確率。較小連通域的閾值為經(jīng)驗(yàn)值,在300DPI下,閾值為100。(5)第二計(jì)算裝置14將連通域最小外接矩形的中心作為Hough變換計(jì)算的輸入點(diǎn)集,在Hough變換參數(shù)空間投票,計(jì)算累積矩陣Α( θ,ρ)。Hough變換是圖像處理領(lǐng)域中的一個(gè)常用算法,多用于直線、圓和三角形的提取。 以提取直線為例,極坐標(biāo)系下的直線方程為P = XCOS θ+ysin θ,由ρ和θ兩個(gè)參數(shù)決定。之所以使用余弦公式而不是斜截式公式,是為了克服斜截式在90°時(shí)斜率趨于無(wú)窮大, 誤差較大的問(wèn)題。Hough變換空間的坐標(biāo)為直線的兩個(gè)參數(shù)。使用余弦公式后,在圖像空間中的每個(gè)點(diǎn)對(duì)應(yīng)于變換空間的一條余弦曲線。圖像空間的每條直線對(duì)應(yīng)變換空間的一個(gè)點(diǎn)ο如圖3所示,圖3a表示直線余弦公式參數(shù)示意,圖北表示圖像空間的三條直線,圖3c表示變換空間對(duì)應(yīng)三個(gè)點(diǎn),越黑代表累積值越大。以圖4所示傾斜的文檔為例,累積矩陣90度附近截圖如圖6所示,越亮代表累積
值越高。(6)檢測(cè)裝置15檢測(cè)累積矩陣Α( θ,ρ )參數(shù)空間的極大值點(diǎn),即八鄰域上最亮的像素點(diǎn)。圖4所示傾斜的文檔,累積矩陣極值點(diǎn),90度附近局部放大截圖如圖7所示。(7)分析裝置16用于在每一個(gè)角度值上,對(duì)徑向方向上的所有點(diǎn)做周期性分析, 選擇出具有一定周期性的角度值。圖4所示傾斜的文檔,周期極值點(diǎn),90度附近截圖如圖8所示。(8)投影裝置17將角度值上極大值點(diǎn)的累積值向角度坐標(biāo)軸上投影,形成一維數(shù)據(jù)Ρ(θ),即尋找滿足下式的θ max(P( θ )+Ρ( θ+90° ))。圖4所示傾斜的文檔,投影后的效果如圖9所示。(9)判斷裝置18在所述一維數(shù)據(jù)Ρ( θ )中,檢測(cè)間隔90°的累加最大的峰對(duì)。由最大峰對(duì)所在角度判斷出傾斜角度,得到文檔傾斜角度。θ角度找到后,即可確定傾斜角度,傾斜的角度絕對(duì)值為I θ |,如果θ >0代表文檔向順時(shí)針?lè)较騼A斜;如果θ <0代表文檔向逆時(shí)針?lè)较騼A斜。顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其同等技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1.一種文檔傾斜檢測(cè)方法,其特征在于,包括以下步驟(1)對(duì)文檔圖像進(jìn)行二值化處理,得到二值文檔圖像;(2)計(jì)算二值文檔圖像中的連通域、所述連通域的外接矩形以及所述外接矩形的中心點(diǎn)坐標(biāo);(3)將所述連通域最小外接矩形的中心作為Hough變換計(jì)算的輸入點(diǎn)集,在Hough變換參數(shù)空間投票,計(jì)算累加矩陣Α( θ,ρ);(4)檢測(cè)所述累加矩陣參數(shù)空間的極大值點(diǎn);(5)將角度值上極大值點(diǎn)的累積值向角度坐標(biāo)軸上投影,形成一維數(shù)據(jù)Ρ(θ );(6)在所述一維數(shù)據(jù)Ρ(θ )中,檢測(cè)間隔90°的累加最大的峰對(duì),由最大峰對(duì)所在角度判斷出傾斜角度,得到文檔傾斜角度。
2.如權(quán)利要求1所述的文檔傾斜檢測(cè)方法,其特征在于所述方法在步驟(1)之前還包括對(duì)文檔圖像進(jìn)行預(yù)處理的步驟。
3.如權(quán)利要求2所述的文檔傾斜檢測(cè)方法,其特征在于所述預(yù)處理包括對(duì)所述文檔圖像進(jìn)行降噪處理。
4.如權(quán)利要求1所述的文檔傾斜檢測(cè)方法,其特征在于所述方法在步驟( 和步驟 (3)之間還包括按照掃描的DPI信息篩除過(guò)小連通域的步驟。
5.如權(quán)利要求4所述的文檔傾斜檢測(cè)方法,其特征在于在300DPI下,過(guò)小連通域的閾值為100。
6.如權(quán)利要求1 5中任一項(xiàng)所述的文檔傾斜檢測(cè)方法,其特征在于所述方法在步驟(4)和步驟( 之間還包括如下步驟在每一個(gè)角度值上,對(duì)徑向方向上的所有點(diǎn)做周期性分析,選擇出具有一定周期性的角度值。
7.一種文檔傾斜檢測(cè)系統(tǒng),其特征在于包括用于對(duì)文檔圖像進(jìn)行二值化處理,得到二值文檔圖像的二值化處理裝置(11);用于計(jì)算二值圖像中的連通域、連通域的外接矩形以及外接矩形中心點(diǎn)坐標(biāo)的第一計(jì)算裝置(12);用于將所述連通域最小外接矩形的中心作為Hough變換計(jì)算的輸入點(diǎn)集,在Hough變換參數(shù)空間投票,計(jì)算累加矩陣Α( θ,ρ)的第二計(jì)算裝置(14);用于檢測(cè)累加矩陣參數(shù)空間極大值點(diǎn)的檢測(cè)裝置(15);用于將角度值上極大值點(diǎn)的累積值向角度坐標(biāo)軸上投影,形成一維數(shù)據(jù)Ρ( θ )的投影裝置(17);用于在一維數(shù)據(jù)Ρ(θ)中,檢測(cè)間隔90°的累加最大的峰對(duì),由最大峰對(duì)所在角度判斷出傾斜角度的判斷裝置(18)。
8.如權(quán)利要求7所述的文檔傾斜檢測(cè)系統(tǒng),其特征在于所述系統(tǒng)還包括用于對(duì)文檔圖像進(jìn)行預(yù)處理的預(yù)處理裝置(10)。
9.如權(quán)利要求7所述的文檔傾斜檢測(cè)系統(tǒng),其特征在于所述系統(tǒng)還包括用于按照掃描的DPI信息篩除過(guò)小連通域的篩除裝置(13)。
10.如權(quán)利要求7 9中任一項(xiàng)所述的文檔傾斜檢測(cè)系統(tǒng),其特征在于所述系統(tǒng)還包括用于在每一個(gè)角度值上,對(duì)徑向方向上的所有點(diǎn)做周期性分析,選擇出具有一定周期性的角度值的分析裝置(16)。
全文摘要
本發(fā)明涉及一種文檔傾斜檢測(cè)方法及系統(tǒng),屬于文檔檢測(cè)技術(shù)領(lǐng)域。本發(fā)明首先對(duì)文檔圖像進(jìn)行二值化處理,得到二值文檔圖像;然后計(jì)算二值文檔圖像中的連通域、連通域的外接矩形以及外接矩形的中心點(diǎn)坐標(biāo);再將所述連通域最小外接矩形的中心作為Hough變換計(jì)算的輸入點(diǎn)集,在Hough變換參數(shù)空間投票,計(jì)算累加矩陣A(θ,ρ);檢測(cè)參數(shù)空間的極大值點(diǎn);將角度值上極大值點(diǎn)的累積值向角度坐標(biāo)軸上投影,形成一維數(shù)據(jù);最后在一維數(shù)據(jù)中,檢測(cè)間隔90°的累加最大的峰對(duì),由最大峰對(duì)所在角度判斷出傾斜角度,得到文檔的傾斜角度。本發(fā)明適應(yīng)性強(qiáng)、精度高且速度快。
文檔編號(hào)G06K9/32GK102496018SQ20111040471
公開(kāi)日2012年6月13日 申請(qǐng)日期2011年12月8日 優(yōu)先權(quán)日2011年12月8日
發(fā)明者胡希馳 申請(qǐng)人:方正國(guó)際軟件(北京)有限公司, 方正國(guó)際軟件有限公司