System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及圖像處理,具體涉及一種票據文字識別方法。
技術介紹
1、ocr技術是通過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其它印刷品轉化為圖像數據,再利用文字識別技術對圖像數據進行文字識別。例如,采用ocr技術可以獲取票據中的信息,實現了秒級識別、提取票據信息。
2、但是,通常情況下票據的版式較為復雜,比如票據的票面一般至少有兩個印章(一個是票據預印章,另一個是個人或單位蓋章),這些印章可能會壓蓋部分待識別文字,因此在采用ocr技術獲取票據中的信息時,可能由于這些印章而影響文字識別的準確性。此外,由于票據圖像存在旋轉等情況,也給文字識別的準確性帶來一定程度的影響。
技術實現思路
1、針對現有技術所存在的上述缺點,本專利技術提供了一種票據文字識別方法,能夠有效克服現有技術所存在的由于印章干擾和圖像旋轉而難以對票據進行精準文字識別的缺陷。
2、為實現以上目的,本專利技術通過以下技術方案予以實現:
3、一種票據文字識別方法,包括以下步驟:
4、s1、讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正;
5、s2、獲取待識別票據圖像中各像素點的rgb三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于r通道的方差矩陣和最大值矩陣;
6、s3、根據待識別票據圖像關于r通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進
7、s4、采用基于小波變換的插值方法對待識別票據圖像進行圖像插值;
8、s5、確定待識別票據圖像中的文本框區域,利用文字識別模型對文本框區域進行文字識別。
9、優選地,s1中讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正,包括:
10、s11、通過圖像處理庫讀取待識別票據圖像;
11、s12、對待識別票據圖像進行高斯平滑,逐步進行下采樣,構建高斯金字塔;
12、s13、確定合適的分辨率,并在高斯金字塔中對應層的待識別票據圖像上,采用邊緣檢測算法進行邊緣檢測;
13、s14、確定待識別票據圖像中的特征點,并計算待識別票據圖像的傾斜角度;
14、s15、確定待識別票據圖像的旋轉中心,并基于傾斜角度對待識別票據圖像進行旋轉校正。
15、優選地,s14中確定待識別票據圖像中的特征點,并計算待識別票據圖像的傾斜角度,包括:
16、s141、對邊緣檢測后的待識別票據圖像進行連通域分析,標記出所有連通域;
17、s142、從連通域中選擇能夠反映待識別票據圖像傾斜情況的特征點;
18、s143、通過分析特征點之間的方位關系,從特征點中篩選屬于同一邊框的目標特征點;
19、s144、對目標特征點進行擬合,并計算擬合結果與水平方向之間的夾角,得到識別票據圖像的傾斜角度;
20、其中,特征點為邊框的角點或長邊的中點。
21、優選地,s2中獲取待識別票據圖像中各像素點的rgb三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于r通道的方差矩陣和最大值矩陣,包括:
22、s21、將待識別票據圖像的rgb三通道分離出來,分別得到r、g、b三個單通道圖像,并獲取待識別票據圖像中各像素點的rgb三通道數值;
23、s22、以像素點為中心在預設尺寸區域內劃定子圖像,獲取子圖像中所有像素點的r通道數值;
24、s23、計算子圖像中所有像素點的r通道數值的方差,并提取子圖像中所有像素點的r通道數值的最大值,得到中心像素點的r通道方差和r通道最大值;
25、s24、重復s22~s23,直至得到待識別票據圖像中各像素點的r通道方差和r通道最大值;
26、s25、基于待識別票據圖像中各像素點的r通道方差構建方差矩陣,基于待識別票據圖像中各像素點的r通道最大值構建最大值矩陣;
27、其中,預設尺寸區域為3*3。
28、優選地,s3中根據待識別票據圖像關于r通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進行圖像修復,包括:
29、s31、根據方差矩陣和最大值矩陣的分布情況,設定合適的方差閾值和最大值閾值;
30、s32、對待識別票據圖像中各像素點的r通道方差與方差閾值,以及r通道最大值與最大值閾值分別進行比較,若r通道方差小于方差閾值,則將r通道方差置為0,否則將r通道方差置為1;若r通道最大值小于最大值閾值,則將r通道最大值置為0,否則將r通道最大值置為1;
31、s33、對待識別票據圖像中各像素點的r通道方差和r通道最大值進行邏輯或運算,將計算結果為1的像素點確定為待識別票據圖像中的潛在印章區域;
32、s34、采用形態學操作將待識別票據圖像中的潛在印章區域連接起來,形成完整的印章區域,并去除該印章區域;
33、s35、采用基于紋理合成的修復方法對待識別票據圖像進行圖像修復。
34、優選地,s34中采用形態學操作將待識別票據圖像中的潛在印章區域連接起來,形成完整的印章區域,并去除該印章區域,包括:
35、s331、采用形態學操作將待識別票據圖像中的潛在印章區域連接起來,形成完整的印章區域;
36、s332、基于印章區域生成一個二值圖像掩膜,將印章區域設置為白色,其他區域設置為黑色;
37、s333、使用圖像掩膜對待識別票據圖像進行掩膜操作,將圖像掩膜中白色像素點對應的待識別票據圖像中像素點的像素值替換為背景色。
38、優選地,s4中采用基于小波變換的插值方法對待識別票據圖像進行圖像插值,包括:
39、s41、對待識別票據圖像進行小波變換,以將待識別票據圖像分解為反映圖像平滑區域的低頻部分和包含圖像細節信息的高頻部分;
40、s42、對于低頻部分,采用雙線性插值進行圖像插值;
41、s43、對于高頻部分,通過分析小波系數的尺度間持續性和指數衰減性,構建隱馬爾可夫模型刻畫小波系數的概率結構,實現圖像插值;
42、s44、對插值后的低頻部分和高頻部分進行小波逆變換,以重構出插值后的待識別票據圖像;
43、其中,尺度間持續性指的是小波系數在不同尺度間具有一定的相關性,即較大或較小的小波系數在相鄰尺度間可能保持較大或較小的值,這種相關性通過隱馬爾可夫模型的狀態轉移概率矩陣進行捕捉;
44、指數衰減性指的是隨著尺度的增加,小波系數的值呈現指數衰減的趨勢,這種特性通過隱馬爾可夫模型的觀測概率矩陣得到體現。
45、優選地,s43中對于高頻部分,通過分析小波系數的尺度間持續性和指數衰減性,構建隱馬爾可夫模型刻畫小波系數的概率結構,實現本文檔來自技高網...
【技術保護點】
1.一種票據文字識別方法,其特征在于:包括以下步驟:
2.根據權利要求1所述的票據文字識別方法,其特征在于:S1中讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正,包括:
3.根據權利要求2所述的票據文字識別方法,其特征在于:S14中確定待識別票據圖像中的特征點,并計算待識別票據圖像的傾斜角度,包括:
4.根據權利要求1所述的票據文字識別方法,其特征在于:S2中獲取待識別票據圖像中各像素點的RGB三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于R通道的方差矩陣和最大值矩陣,包括:
5.根據權利要求4所述的票據文字識別方法,其特征在于:S3中根據待識別票據圖像關于R通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進行圖像修復,包括:
6.根據權利要求5所述的票據文字識別方法,其特征在于:S34中采用形態學操作將待識別票據圖像中的潛在印章區域連接起來,形成完整的印章區域,并去除該印章區域,包括:
7.根據權利要求1
8.根據權利要求7所述的票據文字識別方法,其特征在于:S43中對于高頻部分,通過分析小波系數的尺度間持續性和指數衰減性,構建隱馬爾可夫模型刻畫小波系數的概率結構,實現圖像插值,包括:
9.根據權利要求1所述的票據文字識別方法,其特征在于:所述文字識別模型基于改進的卷積循環神經網絡構建,改進的卷積循環神經網絡中循環層采用雙向門控循環單元,改進的卷積循環神經網絡依次包括輸入層、卷積層、雙向門控循環單元、隱藏狀態合并和輸出層;
10.根據權利要求9所述的票據文字識別方法,其特征在于:S5中確定待識別票據圖像中的文本框區域,利用文字識別模型對文本框區域進行文字識別之前,包括:
...【技術特征摘要】
1.一種票據文字識別方法,其特征在于:包括以下步驟:
2.根據權利要求1所述的票據文字識別方法,其特征在于:s1中讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正,包括:
3.根據權利要求2所述的票據文字識別方法,其特征在于:s14中確定待識別票據圖像中的特征點,并計算待識別票據圖像的傾斜角度,包括:
4.根據權利要求1所述的票據文字識別方法,其特征在于:s2中獲取待識別票據圖像中各像素點的rgb三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于r通道的方差矩陣和最大值矩陣,包括:
5.根據權利要求4所述的票據文字識別方法,其特征在于:s3中根據待識別票據圖像關于r通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進行圖像修復,包括:
6.根據權利要求5所述的票據文字識別方法,其特征在于:s...
【專利技術屬性】
技術研發人員:管鵬飛,覃志參,李能,
申請(專利權)人:安徽瑞軒供應鏈科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。