System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 久久精品无码专区免费东京热,欧洲精品久久久av无码电影,国产免费av片在线无码免费看
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于光學(xué)字符識別的文字檢測方法、介質(zhì)及系統(tǒng)技術(shù)方案

    技術(shù)編號:44399740 閱讀:2 留言:0更新日期:2025-02-25 10:13
    本發(fā)明專利技術(shù)公開了一種基于光學(xué)字符識別的文字檢測方法、介質(zhì)及系統(tǒng),其中方法包括:獲取屏幕圖片,并對所述屏幕圖片進(jìn)行二值化處理,以生成所述屏幕圖片對應(yīng)的二值化圖片;對所述二值化圖片進(jìn)行單文字識別,以得到所述二值化圖片中每個(gè)文字對應(yīng)的邊框坐標(biāo)信息和置信度;基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾;對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字;如果是,則對異常文字進(jìn)行標(biāo)記;能夠?qū)ξ谋局械漠惓N淖诌M(jìn)行有效識別,防止異常文字被誤刪除導(dǎo)致無法閱讀。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本申請涉及文字檢測,特別涉及一種基于光學(xué)字符識別的文字檢測方法、介質(zhì)及系統(tǒng)


    技術(shù)介紹

    1、光學(xué)字符識別(簡稱ocr)技術(shù)經(jīng)過幾十年發(fā)展,其應(yīng)用領(lǐng)域已經(jīng)深入工業(yè)、國防、生活等領(lǐng)域的各個(gè)方面,在解決由圖識文方面的發(fā)展已經(jīng)獲得了巨大的成功。然而,ocr在識別精度不斷提高的模型和算法優(yōu)化下,依然在一些場景使用下存在一定的局限性。如文字過小、過密導(dǎo)致文字內(nèi)容無法正常閱讀,文字顏色與背景顏色相近、顏色過淡導(dǎo)致閱讀困難。

    2、相關(guān)技術(shù)中,在使用光學(xué)字符識別技術(shù)進(jìn)行文字的識別時(shí),往往是對一整段文字進(jìn)行文字識別與判斷。通過這種方式,往往會導(dǎo)致一些例如字體過小、過密或顏色過淡的有效信息被過濾,無法閱讀。


    技術(shù)實(shí)現(xiàn)思路

    1、本專利技術(shù)旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此,本專利技術(shù)的一個(gè)目的在于提出一種基于光學(xué)字符識別的文字檢測方法,能夠?qū)ξ谋局械漠惓N淖诌M(jìn)行有效識別,防止異常文字被誤刪除導(dǎo)致無法閱讀。

    2、第一方面,本專利技術(shù)提出了一種基于光學(xué)字符識別的文字檢測方法,包括:獲取屏幕圖片,并對所述屏幕圖片進(jìn)行二值化處理,以生成所述屏幕圖片對應(yīng)的二值化圖片;對所述二值化圖片進(jìn)行單文字識別,以得到所述二值化圖片中每個(gè)文字對應(yīng)的邊框坐標(biāo)信息和置信度;基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾;對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字;如果是,則對異常文字進(jìn)行標(biāo)記。

    3、根據(jù)本專利技術(shù)實(shí)施例的基于光學(xué)字符識別的文字檢測方法,首先,獲取屏幕圖片,并對所述屏幕圖片進(jìn)行二值化處理,以生成所述屏幕圖片對應(yīng)的二值化圖片;接著,對所述二值化圖片進(jìn)行單文字識別,以得到所述二值化圖片中每個(gè)文字對應(yīng)的邊框坐標(biāo)信息和置信度;然后,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾;接著,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字;然后,如果是,則對異常文字進(jìn)行標(biāo)記;從而實(shí)現(xiàn)對文本中的異常文字進(jìn)行有效識別,防止異常文字被誤刪除導(dǎo)致無法閱讀。

    4、在一些實(shí)施例中,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:判斷當(dāng)前文字所對應(yīng)的置信度知否小于所述預(yù)設(shè)置信度閾值;如果所述當(dāng)前文字所對應(yīng)的置信度小于所述預(yù)設(shè)置信度閾值,則對所述當(dāng)前文字進(jìn)行過濾。

    5、在一些實(shí)施例中,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:根據(jù)所述邊框坐標(biāo)信息計(jì)算當(dāng)前文字對應(yīng)的實(shí)際寬度和實(shí)際高度;判斷所述實(shí)際寬度是否小于預(yù)設(shè)寬度閾值或者所述實(shí)際高度是否小于預(yù)設(shè)高度閾值;如果所述實(shí)際寬度小于所述預(yù)設(shè)寬度閾值或者所述實(shí)際高度小于所述預(yù)設(shè)高度閾值,則確定所述當(dāng)前文字為異常文字;如果所述實(shí)際寬度大于等于所述預(yù)設(shè)寬度閾值且所述實(shí)際高度大于等于所述預(yù)設(shè)高度閾值,則根據(jù)所述邊框信息計(jì)算所述當(dāng)前文字的區(qū)域范圍內(nèi)的二值化像素?cái)?shù)量;判斷所述二值化像素?cái)?shù)量是否大于預(yù)設(shè)像素?cái)?shù)量閾值;如果否,則確定所述當(dāng)前文字為異常文字。

    6、在一些實(shí)施例中,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:獲取預(yù)設(shè)下劃線厚度值;根據(jù)所述邊框坐標(biāo)信息和所述預(yù)設(shè)下劃線厚度值確定當(dāng)前文字對應(yīng)的下劃線區(qū)域;對所述下劃線區(qū)域進(jìn)行檢測,以判斷所述下劃線區(qū)域內(nèi)是否存在下劃線;如果是,則確定所述當(dāng)前文字為異常文字。

    7、在一些實(shí)施例中,對所述下劃線區(qū)域進(jìn)行檢測,以判斷所述下劃線區(qū)域內(nèi)是否存在下劃線,包括:判斷所述下劃線區(qū)域內(nèi)是否存在連續(xù)黑色像素;如果是,則計(jì)算所述連續(xù)黑色像素的長度值;判斷所述連續(xù)黑色像素的長度值是否大于預(yù)設(shè)長度閾值;如果是,則確定所述下劃線區(qū)域內(nèi)存在下劃線。

    8、在一些實(shí)施例中,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:根據(jù)所述邊框坐標(biāo)信息計(jì)算當(dāng)前文字的中心點(diǎn)坐標(biāo),并根據(jù)所述邊框坐標(biāo)信息計(jì)算所述當(dāng)前文字的實(shí)際寬度值和實(shí)際高度值;根據(jù)所述中心點(diǎn)坐標(biāo)、所述實(shí)際寬度值和所述實(shí)際高度值計(jì)算所述當(dāng)前文字對應(yīng)的斜體角度值;判斷所述斜體角度值是否大于預(yù)設(shè)角度值閾值;如果是,則確定所述當(dāng)前文字為異常文字。

    9、在一些實(shí)施例中,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:根據(jù)所述邊框坐標(biāo)信息確定當(dāng)前文字對應(yīng)的文字區(qū)域;對所述文字區(qū)域進(jìn)行過濾,以去除所述文字區(qū)域中的白色像素點(diǎn),得到預(yù)選像素點(diǎn)集合;根據(jù)所述預(yù)選像素點(diǎn)集合和所述二值化圖片計(jì)算二值化平均色值;根據(jù)所述預(yù)選像素點(diǎn)集合和所述屏幕圖片計(jì)算原圖平均色值;計(jì)算所述二值化平均色值和所述原圖平均色值之間的差值;判斷所述差值是否大于預(yù)設(shè)差值閾值;如果是,則確定所述當(dāng)前文字為異常文字。

    10、第二方面,本專利技術(shù)實(shí)施例提出了一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有基于光學(xué)字符識別的文字檢測程序,該基于光學(xué)字符識別的文字檢測程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的基于光學(xué)字符識別的文字檢測方法。

    11、第三方面,本專利技術(shù)實(shí)施例提出了一種基于光學(xué)字符識別的文字檢測系統(tǒng),包括:獲取模塊,所述獲取模塊用于獲取屏幕圖片,并對所述屏幕圖片進(jìn)行二值化處理,以生成所述屏幕圖片對應(yīng)的二值化圖片;識別模塊,所述識別模塊用于對所述二值化圖片進(jìn)行單文字識別,以得到所述二值化圖片中每個(gè)文字對應(yīng)的邊框坐標(biāo)信息和置信度;過濾模塊,所述過濾模塊用于基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾;判斷模塊,所述判斷模塊用于對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字;標(biāo)記模塊,所述標(biāo)記模塊用于在判斷文字為異常文字時(shí),對異常文字進(jìn)行標(biāo)記。

    12、根據(jù)本專利技術(shù)實(shí)施例的基于光學(xué)字符識別的文字檢測系統(tǒng),通過設(shè)置獲取模塊用于獲取屏幕圖片,并對所述屏幕圖片進(jìn)行二值化處理,以生成所述屏幕圖片對應(yīng)的二值化圖片;識別模塊用于對所述二值化圖片進(jìn)行單文字識別,以得到所述二值化圖片中每個(gè)文字對應(yīng)的邊框坐標(biāo)信息和置信度;過濾模塊用于基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾;判斷模塊用于對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字;標(biāo)記模塊用于在判斷文字為異常文字時(shí),對異常文字進(jìn)行標(biāo)記;從而實(shí)現(xiàn)對文本中的異常文字進(jìn)行有效識別,防止異常文字被誤刪除導(dǎo)致無法閱讀。

    13、在一些實(shí)施例中,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:判斷當(dāng)前文字所對應(yīng)的置信度知否小于所述預(yù)設(shè)置信度閾值;如果所述當(dāng)前文字所對應(yīng)的置信度小于所述預(yù)設(shè)置信度閾值,則對所述當(dāng)前文字進(jìn)行過濾。

    14、本專利技術(shù)附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術(shù)的實(shí)踐了解到。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種基于光學(xué)字符識別的文字檢測方法,其特征在于,包括以下步驟:

    2.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:

    3.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:

    4.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:

    5.如權(quán)利要求4所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,對所述下劃線區(qū)域進(jìn)行檢測,以判斷所述下劃線區(qū)域內(nèi)是否存在下劃線,包括:

    6.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:

    7.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:

    8.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,其上存儲有基于光學(xué)字符識別的文字檢測程序,該基于光學(xué)字符識別的文字檢測程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的基于光學(xué)字符識別的文字檢測方法。

    9.一種基于光學(xué)字符識別的文字檢測系統(tǒng),其特征在于,包括:

    10.如權(quán)利要求9所述的基于光學(xué)字符識別的文字檢測系統(tǒng),其特征在于,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:

    ...

    【技術(shù)特征摘要】

    1.一種基于光學(xué)字符識別的文字檢測方法,其特征在于,包括以下步驟:

    2.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:

    3.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:

    4.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:

    5.如權(quán)利要求4所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,對所述下劃線區(qū)域進(jìn)行檢測,以判斷所述下劃線區(qū)域內(nèi)是否存在下劃線,包括:

    6.如權(quán)利要求1所述的基于光學(xué)字符識別的文...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:陳濱梁曉斌蘭偉
    申請(專利權(quán))人:廈門嘉佑安科信息技術(shù)有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 13小箩利洗澡无码视频网站免费| 免费A级毛片无码A∨| 亚洲Av无码精品色午夜| 无码精品一区二区三区| 一本色道无码道在线| 丰满熟妇人妻Av无码区| 无码狠狠躁久久久久久久| 国产aⅴ无码专区亚洲av| 国产乱人伦中文无无码视频试看| 国产成人无码A区在线观看导航 | 精品久久久久久无码人妻| 亚洲日韩VA无码中文字幕| av潮喷大喷水系列无码| 亚洲自偷自偷偷色无码中文 | 亚洲精品GV天堂无码男同| 国产AV无码专区亚洲AV漫画| 久久无码av亚洲精品色午夜| 亚洲va无码专区国产乱码| 中文字幕无码无码专区| 久久无码精品一区二区三区| 无码国产69精品久久久久孕妇| 色爱无码AV综合区| 人妻少妇偷人精品无码| 亚洲国产精品无码久久久不卡| 午夜成人无码福利免费视频| 色国产色无码色欧美色在线| 久久精品无码专区免费东京热| 成人午夜精品无码区久久| 中文无码精品一区二区三区| 无码日韩人妻AV一区免费l| 影院无码人妻精品一区二区| 亚洲成A∨人片天堂网无码| 无码毛片一区二区三区视频免费播放| 在线观看无码AV网站永久免费| JAVA性无码HD中文| 少妇极品熟妇人妻无码| 无码少妇一区二区三区芒果| 无码办公室丝袜OL中文字幕| 黄色成人网站免费无码av| 日韩毛片无码永久免费看| 无码人妻aⅴ一区二区三区|