本發(fā)明專利技術公開了一種應用于票據影像字符識別的數(shù)字圖像處理系統(tǒng)及方法,其中系統(tǒng)方法包括:影像參數(shù)檢測模塊,用于檢測票據影像參數(shù);影像傾斜檢測模塊,用于檢測票據影像中票面的傾斜程度;字符區(qū)域檢測模塊,用于對字符區(qū)域進行定位;字符區(qū)域可識別檢測模塊,用于檢測字符區(qū)域中的字符參數(shù)和印章像素;字符匹配度檢測模塊,用于將字符區(qū)域中的字符與模板進行匹配度檢測;開口特征檢測模塊,用于檢測字符區(qū)域中的字符的開口特征。采用本發(fā)明專利技術可以在銀行票據影像交換的支票影像分析處理過程中提高票據影像字符識別正確率。
【技術實現(xiàn)步驟摘要】
【專利摘要】本專利技術公開了一種,其中系統(tǒng)方法包括:影像參數(shù)檢測模塊,用于檢測票據影像參數(shù);影像傾斜檢測模塊,用于檢測票據影像中票面的傾斜程度;字符區(qū)域檢測模塊,用于對字符區(qū)域進行定位;字符區(qū)域可識別檢測模塊,用于檢測字符區(qū)域中的字符參數(shù)和印章像素;字符匹配度檢測模塊,用于將字符區(qū)域中的字符與模板進行匹配度檢測;開口特征檢測模塊,用于檢測字符區(qū)域中的字符的開口特征。采用本專利技術可以在銀行票據影像交換的支票影像分析處理過程中提高票據影像字符識別正確率。【專利說明】
本專利技術涉及數(shù)字圖像處理及光學字符識別
,尤其涉及應用于票據影像字 符識別的數(shù)字圖像處理系統(tǒng)及方法。
技術介紹
隨著數(shù)字圖像處理、模式識別和人工智能的發(fā)展,光學字符識別(Optical Character Recognition, OCR)技術在金融領域,尤其是票據影像票面要素合法性檢驗、票 據業(yè)務流程再造等方面得到了越來越多的應用。目前光學字符識別系統(tǒng)主要處理流程如圖 1所示,大體可分為影像輸入、影像預處理、字符特征提取、字符匹配識別這四個步驟。 第一個步驟是影像輸入,主要利用光學儀器對待識別的標的物(如書籍、文件、證 件等)進行掃描,從而生成相應的影像數(shù)據,光學儀器包括掃描儀、傳真機、數(shù)碼相機或者 其他攝影器。影像生成時光照條件,影像的分辨率等因素,將影響后續(xù)識別的效果和精度。 第二個步驟為圖像的預處理,這是根據前一階段生成影像的特點,對影像進行處 理以便于后續(xù)階段的字符提取,主要包括影像色彩校正、影像傾斜校正、噪聲過濾以及統(tǒng)一 將影像轉換成黑白二部圖或者是灰度圖。預處理具體細節(jié)流程,需要根據影像數(shù)據的特點 和參數(shù)進行設計,例如影像存在不同程度的色偏,預處理階段就必須包含色彩矯正這一步。 第三個、第四個步驟分別為字符特征提取和匹配識別,主要是將上一階段的字符 區(qū)域按照字符進行分割,然后對單個字符提取其字符特征,為后續(xù)匹配識別做準備。目前的 識別方法主要有兩種,一為統(tǒng)計的特征,例如記錄區(qū)域內的黑/白像素數(shù)比,當文字區(qū)分成 好幾個區(qū)域時,這一個個區(qū)域黑/白像素比的聯(lián)合,就成了空間的一個數(shù)值向量,稱為特征 向量,在后續(xù)識別時只需與該特征向量進行比對即可。而另一類特征為結構的特征,如字符 影像細線化后,取得字符的筆劃端點、交叉點的數(shù)量及位置,或以筆劃段等字符拓撲結構參 數(shù)為特征,然后在特征庫中進行比對即可得到結果。 如上所述,目前字符識別方法的主要流程架構、尤其是第三、第四步驟已經比較成 熟穩(wěn)定,而影響其識別正確率的關鍵,在于第二個步驟影像預處理,待識別的標的物因為其 自身特點的不同,以及影像數(shù)據的掃描過程、掃描生成時的光照條件的不同和成像設備的 個體差異,都會造成影像包含各種各樣的影響識別的"噪聲"(以后文中約定噪聲即表示影 響識別圖像中字符的因素),一個通用的識別系統(tǒng)由于效率、性能、成本和可行性的緣故,在 設計時往往不可能也不會考慮所有可能影響識別正確率的因素。這即是說,現(xiàn)有通用系統(tǒng) 的設計策略是盡可能多地識別各種影像中的字符,但是其所依據的影像參數(shù)模型卻不能描 述所有的影像問題,因此往往會存在有些影像未能得到合適的預處理就流入后續(xù)的識別步 驟,最終造成識別錯誤。例如銀行票據影像交換中的支票編號識別問題,因為支票在使用的 過程中存在不確定性,往往存在支票編號被印章、手寫字符覆蓋的問題,同時生成的票據影 像也存在光照、色偏上的差異,但是目前通用性的識別系統(tǒng)上沒有對這些特征加以定量地 描述和考慮,所以現(xiàn)有的通用識別系統(tǒng)針對票據的識別結果往往不能令人滿意,難以滿足 金融業(yè)信息錄入,尤其是賬務類信息錄入的嚴格要求,這實際上也是阻礙光學字符識別在 金融業(yè)進一步得到推廣的關鍵。
技術實現(xiàn)思路
本專利技術實施例提供一種應用于票據影像字符識別的數(shù)字圖像處理系統(tǒng),用以在銀 行票據影像交換的支票影像分析處理過程中提高票據影像字符識別正確率,該系統(tǒng)包括: 影像參數(shù)檢測模塊,用于檢測票據影像參數(shù); 影像傾斜檢測模塊,用于檢測票據影像中票面的傾斜程度; 字符區(qū)域檢測模塊,用于對字符區(qū)域進行定位; 字符區(qū)域可識別檢測模塊,用于檢測字符區(qū)域中的字符參數(shù)和印章像素; 字符匹配度檢測模塊,用于將字符區(qū)域中的字符與模板進行匹配度檢測; 開口特征檢測模塊,用于檢測字符區(qū)域中的字符的開口特征。 一個實施例中,所述影像參數(shù)檢測模塊具體用于: 檢測票據影像是否符合分辨率、影像尺寸和影像格式要求,以及是否包含完整票 據畫面,在達不到要求時確定票據為落地處理。 一個實施例中,所述影像傾斜檢測模塊具體用于: 通過掃描票據影像中的票面邊緣獲取票面傾斜角度,在傾斜角度不超過閾值時進 行傾斜矯正并檢測矯正結果,在傾斜角度超過閾值或經過矯正仍存在傾斜時確定票據為落 地處理。 一個實施例中,所述影像傾斜檢測模塊具體用于: 通過橫向掃描記錄出支票上邊緣的中部的點集的坐標,根據記錄的坐標進行直線 擬合,再根據擬合上邊緣直線的傾斜角度對票據影像進行雙線性旋轉。 一個實施例中,所述字符區(qū)域檢測模塊具體用于: 根據票據影像中票面結構和票面偏移情況,獲取支票編號區(qū)域在票據影像中的位 置坐標和尺寸大小,判斷是否能夠分割出支票編號區(qū)域,若不能分割出支票編號區(qū)域則確 定票據為落地處理。 -個實施例中,所述字符區(qū)域檢測模塊具體用于: 測量出影像右上角中黑色背景的橫向和縱向上的長度,以定位支票票面右上角的 確定坐標位置;劃定字符區(qū)域相對票面的位置和大小;通過動態(tài)調整確定字符區(qū)域的具體 大小和位置坐標。 -個實施例中,所述字符區(qū)域可識別檢測模塊具體用于: 對字符區(qū)域中每一個單個數(shù)字字符進行定位分割,檢測數(shù)字及數(shù)字之間間隙的個 數(shù)、寬度和高度是否符合字符參數(shù)要求;在HSV色彩空間對字符區(qū)域進行掃描,檢測字符區(qū) 域的印章像素;如果不符合字符參數(shù)要求或印章像素個數(shù)超過閾值,則確定票據為落地處 理。 -個實施例中,所述字符匹配度檢測模塊具體用于: 將字符區(qū)域中定位分割出的每一個單個數(shù)字字符與模板進行匹配度檢測,并與票 據影像字符識別結果進行比對。 -個實施例中,所述開口特征檢測模塊具體用于: 檢測字符區(qū)域中定位分割出的每一個單個數(shù)字字符的開口特征;在開口特征、匹 配度、識別結果均一致時,確定字符識別成功,否則確定票據為落地處理。 本專利技術實施例還提供一種應用于票據影像字符識別的數(shù)字圖像處理方法,用以在 銀行票據影像交換的支票影像分析處理過程中提高票據影像字符識別正確率,該方法包 括: 檢測票據影像參數(shù); 檢測票據影像中票面的傾斜程度; 對字符區(qū)域進行定位; 檢測字符區(qū)域中的字符參數(shù)和印章像素; 將字符區(qū)域中的字符與模板進行匹配度檢測; 檢測字符區(qū)域中的字符的開口特征。 -個實施例中,所述檢測票據影像參數(shù),包括: 檢測票據影像是否符合分辨率、影像尺寸和影像格式要求,以及是否包含完整票 據畫面,在達不到要求時確定票據為落地處理。 -個實施例中,所述檢測票據影像中票面的傾斜程度,包括: 通過掃描票據影像中的票面邊緣獲取票面傾斜角度,在傾斜角度不超本文檔來自技高網...

【技術保護點】
一種應用于票據影像字符識別的數(shù)字圖像處理系統(tǒng),其特征在于,包括:影像參數(shù)檢測模塊,用于檢測票據影像參數(shù);影像傾斜檢測模塊,用于檢測票據影像中票面的傾斜程度;字符區(qū)域檢測模塊,用于對字符區(qū)域進行定位;字符區(qū)域可識別檢測模塊,用于檢測字符區(qū)域中的字符參數(shù)和印章像素;字符匹配度檢測模塊,用于將字符區(qū)域中的字符與模板進行匹配度檢測;開口特征檢測模塊,用于檢測字符區(qū)域中的字符的開口特征。
【技術特征摘要】
【專利技術屬性】
技術研發(fā)人員:曾修遠,蘇永前,王彥紅,程煒華,周程偉,趙文哲,
申請(專利權)人:中國工商銀行股份有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。