System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請涉及文字檢測,特別涉及一種基于光學(xué)字符識別的文字檢測方法、介質(zhì)及系統(tǒng)。
技術(shù)介紹
1、光學(xué)字符識別(簡稱ocr)技術(shù)經(jīng)過幾十年發(fā)展,其應(yīng)用領(lǐng)域已經(jīng)深入工業(yè)、國防、生活等領(lǐng)域的各個(gè)方面,在解決由圖識文方面的發(fā)展已經(jīng)獲得了巨大的成功。然而,ocr在識別精度不斷提高的模型和算法優(yōu)化下,依然在一些場景使用下存在一定的局限性。如文字過小、過密導(dǎo)致文字內(nèi)容無法正常閱讀,文字顏色與背景顏色相近、顏色過淡導(dǎo)致閱讀困難。
2、相關(guān)技術(shù)中,在使用光學(xué)字符識別技術(shù)進(jìn)行文字的識別時(shí),往往是對一整段文字進(jìn)行文字識別與判斷。通過這種方式,往往會導(dǎo)致一些例如字體過小、過密或顏色過淡的有效信息被過濾,無法閱讀。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此,本專利技術(shù)的一個(gè)目的在于提出一種基于光學(xué)字符識別的文字檢測方法,能夠?qū)ξ谋局械漠惓N淖诌M(jìn)行有效識別,防止異常文字被誤刪除導(dǎo)致無法閱讀。
2、第一方面,本專利技術(shù)提出了一種基于光學(xué)字符識別的文字檢測方法,包括:獲取屏幕圖片,并對所述屏幕圖片進(jìn)行二值化處理,以生成所述屏幕圖片對應(yīng)的二值化圖片;對所述二值化圖片進(jìn)行單文字識別,以得到所述二值化圖片中每個(gè)文字對應(yīng)的邊框坐標(biāo)信息和置信度;基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾;對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字;如果是,則對異常文字進(jìn)行標(biāo)記。
3、根據(jù)本專利技術(shù)實(shí)施例的基于光學(xué)字符識別的文字檢測方法,首先,獲取
4、在一些實(shí)施例中,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:判斷當(dāng)前文字所對應(yīng)的置信度知否小于所述預(yù)設(shè)置信度閾值;如果所述當(dāng)前文字所對應(yīng)的置信度小于所述預(yù)設(shè)置信度閾值,則對所述當(dāng)前文字進(jìn)行過濾。
5、在一些實(shí)施例中,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:根據(jù)所述邊框坐標(biāo)信息計(jì)算當(dāng)前文字對應(yīng)的實(shí)際寬度和實(shí)際高度;判斷所述實(shí)際寬度是否小于預(yù)設(shè)寬度閾值或者所述實(shí)際高度是否小于預(yù)設(shè)高度閾值;如果所述實(shí)際寬度小于所述預(yù)設(shè)寬度閾值或者所述實(shí)際高度小于所述預(yù)設(shè)高度閾值,則確定所述當(dāng)前文字為異常文字;如果所述實(shí)際寬度大于等于所述預(yù)設(shè)寬度閾值且所述實(shí)際高度大于等于所述預(yù)設(shè)高度閾值,則根據(jù)所述邊框信息計(jì)算所述當(dāng)前文字的區(qū)域范圍內(nèi)的二值化像素?cái)?shù)量;判斷所述二值化像素?cái)?shù)量是否大于預(yù)設(shè)像素?cái)?shù)量閾值;如果否,則確定所述當(dāng)前文字為異常文字。
6、在一些實(shí)施例中,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:獲取預(yù)設(shè)下劃線厚度值;根據(jù)所述邊框坐標(biāo)信息和所述預(yù)設(shè)下劃線厚度值確定當(dāng)前文字對應(yīng)的下劃線區(qū)域;對所述下劃線區(qū)域進(jìn)行檢測,以判斷所述下劃線區(qū)域內(nèi)是否存在下劃線;如果是,則確定所述當(dāng)前文字為異常文字。
7、在一些實(shí)施例中,對所述下劃線區(qū)域進(jìn)行檢測,以判斷所述下劃線區(qū)域內(nèi)是否存在下劃線,包括:判斷所述下劃線區(qū)域內(nèi)是否存在連續(xù)黑色像素;如果是,則計(jì)算所述連續(xù)黑色像素的長度值;判斷所述連續(xù)黑色像素的長度值是否大于預(yù)設(shè)長度閾值;如果是,則確定所述下劃線區(qū)域內(nèi)存在下劃線。
8、在一些實(shí)施例中,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:根據(jù)所述邊框坐標(biāo)信息計(jì)算當(dāng)前文字的中心點(diǎn)坐標(biāo),并根據(jù)所述邊框坐標(biāo)信息計(jì)算所述當(dāng)前文字的實(shí)際寬度值和實(shí)際高度值;根據(jù)所述中心點(diǎn)坐標(biāo)、所述實(shí)際寬度值和所述實(shí)際高度值計(jì)算所述當(dāng)前文字對應(yīng)的斜體角度值;判斷所述斜體角度值是否大于預(yù)設(shè)角度值閾值;如果是,則確定所述當(dāng)前文字為異常文字。
9、在一些實(shí)施例中,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:根據(jù)所述邊框坐標(biāo)信息確定當(dāng)前文字對應(yīng)的文字區(qū)域;對所述文字區(qū)域進(jìn)行過濾,以去除所述文字區(qū)域中的白色像素點(diǎn),得到預(yù)選像素點(diǎn)集合;根據(jù)所述預(yù)選像素點(diǎn)集合和所述二值化圖片計(jì)算二值化平均色值;根據(jù)所述預(yù)選像素點(diǎn)集合和所述屏幕圖片計(jì)算原圖平均色值;計(jì)算所述二值化平均色值和所述原圖平均色值之間的差值;判斷所述差值是否大于預(yù)設(shè)差值閾值;如果是,則確定所述當(dāng)前文字為異常文字。
10、第二方面,本專利技術(shù)實(shí)施例提出了一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有基于光學(xué)字符識別的文字檢測程序,該基于光學(xué)字符識別的文字檢測程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的基于光學(xué)字符識別的文字檢測方法。
11、第三方面,本專利技術(shù)實(shí)施例提出了一種基于光學(xué)字符識別的文字檢測系統(tǒng),包括:獲取模塊,所述獲取模塊用于獲取屏幕圖片,并對所述屏幕圖片進(jìn)行二值化處理,以生成所述屏幕圖片對應(yīng)的二值化圖片;識別模塊,所述識別模塊用于對所述二值化圖片進(jìn)行單文字識別,以得到所述二值化圖片中每個(gè)文字對應(yīng)的邊框坐標(biāo)信息和置信度;過濾模塊,所述過濾模塊用于基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾;判斷模塊,所述判斷模塊用于對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字;標(biāo)記模塊,所述標(biāo)記模塊用于在判斷文字為異常文字時(shí),對異常文字進(jìn)行標(biāo)記。
12、根據(jù)本專利技術(shù)實(shí)施例的基于光學(xué)字符識別的文字檢測系統(tǒng),通過設(shè)置獲取模塊用于獲取屏幕圖片,并對所述屏幕圖片進(jìn)行二值化處理,以生成所述屏幕圖片對應(yīng)的二值化圖片;識別模塊用于對所述二值化圖片進(jìn)行單文字識別,以得到所述二值化圖片中每個(gè)文字對應(yīng)的邊框坐標(biāo)信息和置信度;過濾模塊用于基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾;判斷模塊用于對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字;標(biāo)記模塊用于在判斷文字為異常文字時(shí),對異常文字進(jìn)行標(biāo)記;從而實(shí)現(xiàn)對文本中的異常文字進(jìn)行有效識別,防止異常文字被誤刪除導(dǎo)致無法閱讀。
13、在一些實(shí)施例中,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:判斷當(dāng)前文字所對應(yīng)的置信度知否小于所述預(yù)設(shè)置信度閾值;如果所述當(dāng)前文字所對應(yīng)的置信度小于所述預(yù)設(shè)置信度閾值,則對所述當(dāng)前文字進(jìn)行過濾。
14、本專利技術(shù)附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術(shù)的實(shí)踐了解到。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于光學(xué)字符識別的文字檢測方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:
3.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:
4.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:
5.如權(quán)利要求4所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,對所述下劃線區(qū)域進(jìn)行檢測,以判斷所述下劃線區(qū)域內(nèi)是否存在下劃線,包括:
6.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:
7.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,對于過濾后的每個(gè)文字,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:
8.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,其上存儲有基于光學(xué)字
9.一種基于光學(xué)字符識別的文字檢測系統(tǒng),其特征在于,包括:
10.如權(quán)利要求9所述的基于光學(xué)字符識別的文字檢測系統(tǒng),其特征在于,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:
...【技術(shù)特征摘要】
1.一種基于光學(xué)字符識別的文字檢測方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于預(yù)設(shè)置信度閾值對每個(gè)文字進(jìn)行過濾,包括:
3.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:
4.如權(quán)利要求1所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,基于所述邊框坐標(biāo)信息判斷每個(gè)文字是否為異常文字,包括:
5.如權(quán)利要求4所述的基于光學(xué)字符識別的文字檢測方法,其特征在于,對所述下劃線區(qū)域進(jìn)行檢測,以判斷所述下劃線區(qū)域內(nèi)是否存在下劃線,包括:
6.如權(quán)利要求1所述的基于光學(xué)字符識別的文...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳濱,梁曉斌,蘭偉,
申請(專利權(quán))人:廈門嘉佑安科信息技術(shù)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。