System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 成人无码精品1区2区3区免费看,毛片一区二区三区无码,亚洲AV无码国产在丝袜线观看
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種票據文字識別方法技術

    技術編號:44086922 閱讀:18 留言:0更新日期:2025-01-21 12:24
    本發明專利技術涉及圖像處理,具體涉及一種票據文字識別方法,讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正;獲取待識別票據圖像中各像素點的RGB三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于R通道的方差矩陣和最大值矩陣;根據待識別票據圖像關于R通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進行圖像修復;采用基于小波變換的插值方法對待識別票據圖像進行圖像插值;利用文字識別模型對文本框區域進行文字識別;本發明專利技術提供的技術方案能夠克服現有技術所存在的由于印章干擾和圖像旋轉而難以對票據進行精準文字識別的缺陷。

    【技術實現步驟摘要】

    本專利技術涉及圖像處理,具體涉及一種票據文字識別方法


    技術介紹

    1、ocr技術是通過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其它印刷品轉化為圖像數據,再利用文字識別技術對圖像數據進行文字識別。例如,采用ocr技術可以獲取票據中的信息,實現了秒級識別、提取票據信息。

    2、但是,通常情況下票據的版式較為復雜,比如票據的票面一般至少有兩個印章(一個是票據預印章,另一個是個人或單位蓋章),這些印章可能會壓蓋部分待識別文字,因此在采用ocr技術獲取票據中的信息時,可能由于這些印章而影響文字識別的準確性。此外,由于票據圖像存在旋轉等情況,也給文字識別的準確性帶來一定程度的影響。


    技術實現思路

    1、針對現有技術所存在的上述缺點,本專利技術提供了一種票據文字識別方法,能夠有效克服現有技術所存在的由于印章干擾和圖像旋轉而難以對票據進行精準文字識別的缺陷。

    2、為實現以上目的,本專利技術通過以下技術方案予以實現:

    3、一種票據文字識別方法,包括以下步驟:

    4、s1、讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正;

    5、s2、獲取待識別票據圖像中各像素點的rgb三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于r通道的方差矩陣和最大值矩陣;

    6、s3、根據待識別票據圖像關于r通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進行圖像修復;

    7、s4、采用基于小波變換的插值方法對待識別票據圖像進行圖像插值;

    8、s5、確定待識別票據圖像中的文本框區域,利用文字識別模型對文本框區域進行文字識別。

    9、優選地,s1中讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正,包括:

    10、s11、通過圖像處理庫讀取待識別票據圖像;

    11、s12、對待識別票據圖像進行高斯平滑,逐步進行下采樣,構建高斯金字塔;

    12、s13、確定合適的分辨率,并在高斯金字塔中對應層的待識別票據圖像上,采用邊緣檢測算法進行邊緣檢測;

    13、s14、確定待識別票據圖像中的特征點,并計算待識別票據圖像的傾斜角度;

    14、s15、確定待識別票據圖像的旋轉中心,并基于傾斜角度對待識別票據圖像進行旋轉校正。

    15、優選地,s14中確定待識別票據圖像中的特征點,并計算待識別票據圖像的傾斜角度,包括:

    16、s141、對邊緣檢測后的待識別票據圖像進行連通域分析,標記出所有連通域;

    17、s142、從連通域中選擇能夠反映待識別票據圖像傾斜情況的特征點;

    18、s143、通過分析特征點之間的方位關系,從特征點中篩選屬于同一邊框的目標特征點;

    19、s144、對目標特征點進行擬合,并計算擬合結果與水平方向之間的夾角,得到識別票據圖像的傾斜角度;

    20、其中,特征點為邊框的角點或長邊的中點。

    21、優選地,s2中獲取待識別票據圖像中各像素點的rgb三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于r通道的方差矩陣和最大值矩陣,包括:

    22、s21、將待識別票據圖像的rgb三通道分離出來,分別得到r、g、b三個單通道圖像,并獲取待識別票據圖像中各像素點的rgb三通道數值;

    23、s22、以像素點為中心在預設尺寸區域內劃定子圖像,獲取子圖像中所有像素點的r通道數值;

    24、s23、計算子圖像中所有像素點的r通道數值的方差,并提取子圖像中所有像素點的r通道數值的最大值,得到中心像素點的r通道方差和r通道最大值;

    25、s24、重復s22~s23,直至得到待識別票據圖像中各像素點的r通道方差和r通道最大值;

    26、s25、基于待識別票據圖像中各像素點的r通道方差構建方差矩陣,基于待識別票據圖像中各像素點的r通道最大值構建最大值矩陣;

    27、其中,預設尺寸區域為3*3。

    28、優選地,s3中根據待識別票據圖像關于r通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進行圖像修復,包括:

    29、s31、根據方差矩陣和最大值矩陣的分布情況,設定合適的方差閾值和最大值閾值;

    30、s32、對待識別票據圖像中各像素點的r通道方差與方差閾值,以及r通道最大值與最大值閾值分別進行比較,若r通道方差小于方差閾值,則將r通道方差置為0,否則將r通道方差置為1;若r通道最大值小于最大值閾值,則將r通道最大值置為0,否則將r通道最大值置為1;

    31、s33、對待識別票據圖像中各像素點的r通道方差和r通道最大值進行邏輯或運算,將計算結果為1的像素點確定為待識別票據圖像中的潛在印章區域;

    32、s34、采用形態學操作將待識別票據圖像中的潛在印章區域連接起來,形成完整的印章區域,并去除該印章區域;

    33、s35、采用基于紋理合成的修復方法對待識別票據圖像進行圖像修復。

    34、優選地,s34中采用形態學操作將待識別票據圖像中的潛在印章區域連接起來,形成完整的印章區域,并去除該印章區域,包括:

    35、s331、采用形態學操作將待識別票據圖像中的潛在印章區域連接起來,形成完整的印章區域;

    36、s332、基于印章區域生成一個二值圖像掩膜,將印章區域設置為白色,其他區域設置為黑色;

    37、s333、使用圖像掩膜對待識別票據圖像進行掩膜操作,將圖像掩膜中白色像素點對應的待識別票據圖像中像素點的像素值替換為背景色。

    38、優選地,s4中采用基于小波變換的插值方法對待識別票據圖像進行圖像插值,包括:

    39、s41、對待識別票據圖像進行小波變換,以將待識別票據圖像分解為反映圖像平滑區域的低頻部分和包含圖像細節信息的高頻部分;

    40、s42、對于低頻部分,采用雙線性插值進行圖像插值;

    41、s43、對于高頻部分,通過分析小波系數的尺度間持續性和指數衰減性,構建隱馬爾可夫模型刻畫小波系數的概率結構,實現圖像插值;

    42、s44、對插值后的低頻部分和高頻部分進行小波逆變換,以重構出插值后的待識別票據圖像;

    43、其中,尺度間持續性指的是小波系數在不同尺度間具有一定的相關性,即較大或較小的小波系數在相鄰尺度間可能保持較大或較小的值,這種相關性通過隱馬爾可夫模型的狀態轉移概率矩陣進行捕捉;

    44、指數衰減性指的是隨著尺度的增加,小波系數的值呈現指數衰減的趨勢,這種特性通過隱馬爾可夫模型的觀測概率矩陣得到體現。

    45、優選地,s43中對于高頻部分,通過分析小波系數的尺度間持續性和指數衰減性,構建隱馬爾可夫模型刻畫小波系數的概率結構,實現本文檔來自技高網...

    【技術保護點】

    1.一種票據文字識別方法,其特征在于:包括以下步驟:

    2.根據權利要求1所述的票據文字識別方法,其特征在于:S1中讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正,包括:

    3.根據權利要求2所述的票據文字識別方法,其特征在于:S14中確定待識別票據圖像中的特征點,并計算待識別票據圖像的傾斜角度,包括:

    4.根據權利要求1所述的票據文字識別方法,其特征在于:S2中獲取待識別票據圖像中各像素點的RGB三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于R通道的方差矩陣和最大值矩陣,包括:

    5.根據權利要求4所述的票據文字識別方法,其特征在于:S3中根據待識別票據圖像關于R通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進行圖像修復,包括:

    6.根據權利要求5所述的票據文字識別方法,其特征在于:S34中采用形態學操作將待識別票據圖像中的潛在印章區域連接起來,形成完整的印章區域,并去除該印章區域,包括:

    7.根據權利要求1所述的票據文字識別方法,其特征在于:S4中采用基于小波變換的插值方法對待識別票據圖像進行圖像插值,包括:

    8.根據權利要求7所述的票據文字識別方法,其特征在于:S43中對于高頻部分,通過分析小波系數的尺度間持續性和指數衰減性,構建隱馬爾可夫模型刻畫小波系數的概率結構,實現圖像插值,包括:

    9.根據權利要求1所述的票據文字識別方法,其特征在于:所述文字識別模型基于改進的卷積循環神經網絡構建,改進的卷積循環神經網絡中循環層采用雙向門控循環單元,改進的卷積循環神經網絡依次包括輸入層、卷積層、雙向門控循環單元、隱藏狀態合并和輸出層;

    10.根據權利要求9所述的票據文字識別方法,其特征在于:S5中確定待識別票據圖像中的文本框區域,利用文字識別模型對文本框區域進行文字識別之前,包括:

    ...

    【技術特征摘要】

    1.一種票據文字識別方法,其特征在于:包括以下步驟:

    2.根據權利要求1所述的票據文字識別方法,其特征在于:s1中讀取待識別票據圖像,確定待識別票據圖像中的特征點,根據特征點對待識別票據圖像進行旋轉校正,包括:

    3.根據權利要求2所述的票據文字識別方法,其特征在于:s14中確定待識別票據圖像中的特征點,并計算待識別票據圖像的傾斜角度,包括:

    4.根據權利要求1所述的票據文字識別方法,其特征在于:s2中獲取待識別票據圖像中各像素點的rgb三通道數值,以各像素點為中心在預設尺寸區域內劃定子圖像,并計算待識別票據圖像關于r通道的方差矩陣和最大值矩陣,包括:

    5.根據權利要求4所述的票據文字識別方法,其特征在于:s3中根據待識別票據圖像關于r通道的方差矩陣和最大值矩陣去除待識別票據圖像中的印章區域,并對待識別票據圖像進行圖像修復,包括:

    6.根據權利要求5所述的票據文字識別方法,其特征在于:s...

    【專利技術屬性】
    技術研發人員:管鵬飛覃志參李能
    申請(專利權)人:安徽瑞軒供應鏈科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产V亚洲V天堂A无码| 亚洲国产成人精品无码久久久久久综合 | 国产成人麻豆亚洲综合无码精品 | 亚洲va中文字幕无码| 亚洲精品无码鲁网中文电影| 亚洲av无码一区二区三区四区| 亚洲一本大道无码av天堂| 色窝窝无码一区二区三区色欲| 狠狠躁夜夜躁无码中文字幕| 免费无遮挡无码视频在线观看| 亚洲AV无码精品国产成人| 亚洲精品无码久久久久sm| 无码精品国产dvd在线观看9久| 无套中出丰满人妻无码| 午夜福利av无码一区二区| 亚洲国产精品无码久久久久久曰 | 国产高清不卡无码视频 | 无码夫の前で人妻を犯す中字| 亚洲国产精品无码久久九九| 精品少妇人妻AV无码专区不卡 | 国产AV巨作情欲放纵无码| 麻豆亚洲AV成人无码久久精品| 国产精品白浆无码流出| 亚洲熟妇无码一区二区三区导航 | 国产精品白浆无码流出| 亚洲日韩国产二区无码| 免费A级毛片无码视频| 一本天堂ⅴ无码亚洲道久久| 无码人妻精品一区二区三区久久 | 亚洲第一极品精品无码久久| 中文字幕无码免费久久9一区9| 免费无码看av的网站| 成人免费a级毛片无码网站入口 | 久久久久亚洲av无码专区喷水| 亚洲精品无码av人在线观看 | 狠狠躁狠狠躁东京热无码专区| 麻豆人妻少妇精品无码专区| 国产av无码专区亚洲av毛片搜| 人妻无码久久久久久久久久久| 下载天堂国产AV成人无码精品网站| 无码无套少妇毛多69XXX|