本發(fā)明專利技術(shù)名片圖像傾斜角度的測量方法和裝置,屬于OCR技術(shù)領(lǐng)域。本方法首先提取名片圖像的邊緣圖像,然后在邊緣圖像中搜索名片的四周邊框直線,根據(jù)邊框直線的傾斜程度判斷圖像是否存在傾斜,對于存在傾斜的圖片,判斷其文字的編輯方向,并沿著文字編輯方向投影,利用投影特征計算圖像的傾斜角度。通過采集圖像的邊框直線的方式對圖像進(jìn)行傾斜判定,可快速將圖像分為傾斜和無傾斜兩類,并分別處理。通過比較圖像水平和豎直兩個方向上投影直方圖的特征來快速判斷文字的編輯方向,確定文字編輯方向?qū)τ谕队坝嬎銉A斜角度和名片圖像的版面分析都具有很大的指導(dǎo)作用。
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)屬于數(shù)字圖像處理技術(shù)及0CR(光學(xué)字符識別)
,特別涉及一種名 片圖像傾斜角度的測量方法和裝置。
技術(shù)介紹
在當(dāng)今的商務(wù)活動中,名片已經(jīng)是商業(yè)合作伙伴、客戶等的重要信息載體,面對大 量的名片,公司和個人都需要有一種方法進(jìn)行自動、準(zhǔn)確地信息采集和處理,目前一般采用 0CR(0ptical Character Recognition)系統(tǒng)完成此功能。在名片OCR系統(tǒng)中,輸入的名片 圖像可能存在一定角度傾斜(一般小于5。),這種傾斜會對名片的版面分析、字符切分及 字符識別產(chǎn)生不良影響,需要進(jìn)行傾斜角度檢測,然后根據(jù)角度進(jìn)行圖像校正。 現(xiàn)有的針對文檔圖像的傾斜檢測方法,基本上都是基于二值圖像的,主要可分為4 類基于投影的方法、基于HOUGH變換的方法、K-最近鄰簇方法和基于交叉相關(guān)性的方法。 對于名片圖像,其特點是文字行(列)較少,通常只有幾行(列)或十幾行(列), 文字個數(shù)較少,排版樣式多變。K-最近鄰簇方法需要較多的文字連通域才能計算出可靠的 結(jié)果,不適合名片圖像;基于交叉相關(guān)性的方法的前提是文本具有一致的排版格式,也不適 合名片圖像;基于HOUGH變換的方法計算量較大。所以上述四類用于文檔圖像傾斜檢測的 方法中,基于投影的方法比較適合名片圖像的傾斜檢測。 申請?zhí)枮?00410080505. X的專利公開了一種圖像處理方法,通過在圖像中搜索 直線并根據(jù)直線的傾斜情況計算圖像傾斜角度,在圖像處理的過程中需要依賴于圖像中的 直線。申請?zhí)枮?00710176208. 9的專利針對復(fù)雜文檔圖像,通過文本區(qū)域及非文本區(qū)域提 取連通區(qū)域的邊界段作為傾斜特征計算傾斜角度,需要圖像中存在較多的連通區(qū)域。這兩 種方法對于名片圖像,這兩種方法適用性較差,而且都是直接計算圖像的傾斜角度,而沒有 預(yù)先自動判斷圖像是否需要計算傾斜角度。對于不存在傾斜的圖像而言,傾斜角度為零,則 不需要進(jìn)行傾斜角度計算。 文獻(xiàn)《灰度名片圖像快速傾斜檢測和校正方法》(《中文信息學(xué)報》2004年01期, 63-70頁)提出一種根據(jù)掃描名片圖像中名片的四條邊框直線進(jìn)行傾斜角度檢測的方法, 該方法簡單快速,但是對于名片圖像不存在邊緣直線的情況則無能為力,而且僅僅根據(jù)邊 緣直線計算出的角度精度不是很高。 利用投影方法計算名片圖像的傾斜角度,計算結(jié)果準(zhǔn)確,但是對于不存在傾斜的 名片圖像進(jìn)行計算,是一種浪費;利用圖像中名片邊框直線計算傾斜角度的方法,簡單快 速,但是對于邊框直線缺失的情況,其失去作用,對于邊框直線受噪聲污染的情況,其計算 結(jié)果不夠準(zhǔn)確。
技術(shù)實現(xiàn)思路
本專利技術(shù)提出了一種名片圖像傾斜角度的測量方法和裝置,本方法首先提取名片圖 像的邊緣圖像,然后在邊緣圖像中搜索名片的四周邊框直線,根據(jù)邊框直線的傾斜程度判4斷圖像是否存在傾斜,對于存在傾斜的圖片,判斷其文字的編輯方向,并沿著文字編輯方向 投影,利用投影特征計算圖像的傾斜角度,既能自動區(qū)分名片圖像傾斜與非傾斜,又能計算 出精確的傾斜角度。 名片圖像傾斜角度的測量方法,包括如下步驟 步驟1 :輸入并提取輸入的名片圖像的邊緣。輸入名片圖像,提取灰度圖像邊緣作 為處理的基本內(nèi)容。 步驟2:搜索名片圖像四周的邊框直線。自外向內(nèi)在四個方向上對圖像依次按行 列逐像素搜索,如果相鄰行列記錄到的第一個黑像素點的坐標(biāo)在搜索方向上的位置差不大 于2個像素,則這兩個黑像素點位于同一線段上,否則,新建線段。如果其中最長的線段長 度超過既定閾值,則該線段所在直線為此方向上的邊框直線,否則,此方向上不存在邊框直 線。 步驟3 :根據(jù)搜索到的邊框直線判斷圖像是否傾斜。如果邊框直線數(shù)大于等于2, 并且標(biāo)定為傾斜的邊框直線數(shù)大于搜索到的邊框直線數(shù)的0. 7倍,則該圖像傾斜;否則,圖 像不存在傾斜,本方法結(jié)束。 步驟4 :對標(biāo)記傾斜的圖像,判斷圖像中文字的編輯方向。分別在圖像的豎直和水 平投影直方圖內(nèi),以相同投影值區(qū)間和投影值間隔劃定直線,分別計算直線穿過的既定寬 度的投影數(shù)目之和;將投影數(shù)目較大的方向作為文字的編輯方向。步驟5 :利用投影方法計算圖像的傾斜角度。在圖像的文字編輯方向上,在_5度到+5度之間,按相等的角度間隔分別對圖像進(jìn)行投影,計算所得的每個投影直方圖投影值的平方和,圖像的傾斜角度為投影平方和值最大的投影直方圖的對應(yīng)的投影角度。 所述步驟2中按行列逐像素搜索時,搜索范圍為該方向上圖像的邊緣至該圖像的 所述步驟2的既定閾值的取值范圍為整個圖像對應(yīng)寬度的;~ ;。 所述步驟3中進(jìn)行傾斜判定,分別取最長線段起止端的相同數(shù)目的坐標(biāo)點的平均 坐標(biāo)值,如果計算所得傾斜角度大于傾斜閾值,則將該線段所在的邊框直線標(biāo)記為傾斜;否 則標(biāo)記為非傾斜;沒有搜索到邊框直線的邊,直接標(biāo)記該邊為傾斜。 所述步驟4中的既定寬度范圍根據(jù)圖像中字符的行高進(jìn)行調(diào)整;投影區(qū)間以水平 和豎直投影直方圖的最大投影值中較小者和其1/3為上下限。 所述步驟4中判定文字編輯方向時,如果豎直和水平兩個方向上的投影數(shù)目相 等,則文字編輯方向為兩投影直方圖的投影值平方和大的方向。 所述步驟5中對圖像進(jìn)行投影時,如果圖像的文字編輯方向為水平方向,將圖像 等分成一系列豎條圖像,并對各豎條圖像按照0°投影,將得到的各投影直方圖合成一個該 投影方向上的整體投影直方圖;如果圖像的文字編輯方向為豎直方向,則將圖像旋轉(zhuǎn)90° 再進(jìn)行上述處理。 所述步驟5中將圖像劃分時,豎條圖像的寬度w為 其中,L為圖像的寬度,a為投影的角度。 名片圖像傾斜角度的測量裝置,由以下模塊組成 圖像輸入模塊,輸入并提取輸入的名片圖像的邊緣。輸入名片圖像,提取灰度圖像 邊緣作為處理的基本內(nèi)容。 邊框搜索模塊,搜索名片圖像四周的邊框直線;自外向內(nèi)在四個方向上對圖像依 次按行列逐像素搜索,如果相鄰行列記錄到的第一個黑像素點的坐標(biāo)在搜索方向上的位置 差不大于2個像素,則這兩個黑像素點位于同一線段上,否則,新建線段。如果其中最長的 線段長度超過既定閾值,則該線段所在直線為此方向上的邊框直線,否則,此方向上不存在 邊框直線。 傾斜判定模塊,根據(jù)搜索到的邊框直線判斷圖像是否傾斜。如果邊框直線數(shù)大于 等于2,并且標(biāo)定為傾斜的邊框直線數(shù)大于搜索到的邊框直線數(shù)的0. 7倍,則該圖像傾斜; 否則,圖像不存在傾斜,本裝置處理過程結(jié)束。 文字方向判定模塊,對標(biāo)記傾斜的圖像,判斷圖像中文字的編輯方向。分別在圖像的豎直和水平投影直方圖內(nèi),以相同投影值區(qū)間和投影值間隔劃定直線,分別計算直線穿過的既定寬度的投影數(shù)目之和;將投影數(shù)目較大的方向作為文字的編輯方向。 角度計算模塊,利用投影方法計算圖像的傾斜角度。在圖像的文字編輯方向上,在_5度到+5度之間,按相等的角度間隔分別對圖像進(jìn)行投影,計算所得的每個投影直方圖投影值的平方和,圖像的傾斜角度為投影平方和值最大的投影直方圖的對應(yīng)的投影角度。 本專利技術(shù)名片圖像傾斜角度的測量方法和裝置,與現(xiàn)有技術(shù)相比優(yōu)點在于 1、本專利技術(shù)通過采集圖像的邊框直線的方式對圖像進(jìn)行傾斜判定,可快速將圖像分為傾斜和無傾斜兩類,對于無傾斜的圖像,不再進(jìn)行傾斜角度的計算步驟,對于傾斜圖像,再利用其他方法計算精確的傾斜角度; 2、本專利技術(shù)通過比較圖像水平和豎直兩個方向上投影直方圖的特征來快速判斷文 字的編輯方向本文檔來自技高網(wǎng)...
【技術(shù)保護點】
一種名片圖像傾斜角度的測量方法,其特征在于,包括如下步驟:步驟一:輸入并提取輸入的名片圖像的邊緣;輸入名片圖像,提取灰度圖像邊緣作為處理的基本內(nèi)容;步驟二:搜索名片圖像四周的邊框直線;自外向內(nèi)在四個方向上對圖像依次按行列逐像素搜索,如果相鄰行列記錄到的第一個黑像素點的坐標(biāo)在搜索方向上的位置差不大于2個像素,則這兩個黑像素點位于同一線段上,否則,新建線段;如果其中最長的線段長度超過既定閾值,則該線段所在直線為此方向上的邊框直線,否則,此方向上不存在邊框直線;步驟三:根據(jù)搜索到的邊框直線判斷圖像是否傾斜;如果邊框直線數(shù)大于等于2,并且標(biāo)定為傾斜的邊框直線數(shù)大于搜索到的邊框直線數(shù)的0.7倍,則該圖像傾斜;否則,圖像不存在傾斜,本方法結(jié)束;步驟四:對標(biāo)記傾斜的圖像,判斷圖像中文字的編輯方向;分別在圖像的豎直和水平投影直方圖內(nèi),以相同投影值區(qū)間和投影值間隔劃定直線,分別計算直線穿過的既定寬度的投影數(shù)目之和;將投影數(shù)目較大的方向作為文字的編輯方向;步驟五:利用投影方法計算圖像的傾斜角度;在圖像的文字編輯方向上,在-5度到+5度之間,按相等的角度間隔分別對圖像進(jìn)行投影,計算所得的每個投影直方圖投影值的平方和,圖像的傾斜角度為投影平方和值最大的投影直方圖的對應(yīng)的投影角度。...
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李永彬,朱軍民,
申請(專利權(quán))人:漢王科技股份有限公司,
類型:發(fā)明
國別省市:11[中國|北京]
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。