System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及字符糾錯,尤其涉及一種字符糾錯方法、裝置、設備、存儲介質及產品。
技術介紹
1、同構異碼字符指同一種編碼方式下存在擁有相似字形結構但不同編碼的相似字符,其在人的眼中是同一個字,而計算機卻認為是不同的字,會給文字信息處理帶來混亂,影響后續業務。例如,在車聯網實名認證過程中,由于用戶上傳的證件圖像的字符轉換結果中存在同構異碼字符,會出現該字符轉換結果對用戶顯示無誤,但無法通過后臺業務,如正則有效校驗、重復性校驗等業務的現象,給用戶實名操作造成干擾。因此,亟需提供一種字符糾錯方法,以規避同構異碼字符的干擾。
技術實現思路
1、本申請提供一種字符糾錯方法、裝置、設備、存儲介質及產品,以解決現有技術中亟需提供一種字符糾錯方法,以規避同構異碼字符的干擾的問題。
2、為實現上述目的,本申請實施例提供了一種字符糾錯方法,包括:
3、獲取輸入圖像的待糾錯字符;
4、對所述待糾錯字符的校驗值進行校驗;
5、若校驗不通過,則計算所述待糾錯字符分別與若干第一預設相似字符之間的第一相似度,根據若干所述第一相似度對所述待糾錯字符進行糾錯。
6、作為上述方案的改進,所述根據若干所述第一相似度對所述待糾錯字符進行糾錯,包括:
7、根據若干所述第一相似度,獲取滿足預設第一相似度條件的所述第一預設相似字符,作為目標相似字符;
8、將所述待糾錯字符修正為所述目標相似字符對應的預設目的字符。
9、作為上述方案的改進,
10、所述第一相似度最大;
11、所述第一相似度大于預設相似度閾值。
12、作為上述方案的改進,通過以下獲取所述預設相似度閾值:
13、構造與預設目的字符相似的若干第二預設相似字符;
14、計算預設目的字符分別與若干所述第二預設相似字符之間的第二相似度;
15、根據若干所述第二相似度,計算相似度特征值,作為所述第二預設相似字符的所述預設相似度閾值。
16、作為上述方案的改進,所述則計算所述待糾錯字符分別與若干第一預設相似字符之間的第一相似度,包括:
17、生成所述待糾錯字符的位圖;
18、計算所述待糾錯字符的位圖分別與若干所述第一預設相似字符的位圖之間的第一相似度。
19、作為上述方案的改進,所述對所述待糾錯字符的校驗值進行校驗,包括:
20、計算所述待糾錯字符的校驗值;
21、將所述待糾錯字符的校驗值分別與若干預設目的字符的校驗值進行比較。
22、為實現上述目的,本申請實施例還提供了一種字符糾錯裝置,包括:
23、獲取模塊,用于獲取輸入圖像的待糾錯字符;
24、校驗模塊,用于對所述待糾錯字符的校驗值進行校驗;
25、糾錯模塊,用于若校驗不通過,則計算所述待糾錯字符分別與若干第一預設相似字符之間的第一相似度,根據若干所述第一相似度對所述待糾錯字符進行糾錯。
26、為實現上述目的,本申請實施例還提供了一種字符糾錯設備,包括處理器、存儲器以及存儲在所述存儲器中且被配置為由所述處理器執行的計算機程序,所述處理器在執行所述計算機程序時實現如上述的字符糾錯方法。
27、為實現上述目的,本申請實施例還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質包括存儲的計算機程序;其中,所述計算機程序在運行時控制所述計算機可讀存儲介質所在的設備執行如上述的字符糾錯方法。
28、為實現上述目的,本申請實施例還提供了一種計算機程序產品,包括計算機程序/指令,該計算機程序/指令被處理器執行時實現如上述的字符糾錯方法。
29、與現有技術相比,本申請實施例提供的一種字符糾錯方法、裝置、設備、存儲介質及產品,首先采用校驗值對待糾錯字符進行校驗,能夠減少待糾錯字符進行第一相似度計算步驟的次數,避免對有效的字符進行重復糾錯。進一步通過待糾錯字符分別與若干第一預設相似字符之間的第一相似度,對待糾錯字符進行糾錯,實現了對同構異碼字符的糾錯,能夠避免同構異碼字符的干擾。
本文檔來自技高網...【技術保護點】
1.一種字符糾錯方法,其特征在于,包括:
2.如權利要求1所述的字符糾錯方法,其特征在于,所述根據若干所述第一相似度對所述待糾錯字符進行糾錯,包括:
3.如權利要求2所述的字符糾錯方法,其特征在于,所述預設第一相似度條件包括以下至少一項:
4.如權利要求3所述的字符糾錯方法,其特征在于,通過以下獲取所述預設相似度閾值:
5.如權利要求1所述的字符糾錯方法,其特征在于,所述則計算所述待糾錯字符分別與若干第一預設相似字符之間的第一相似度,包括:
6.如權利要求1所述的字符糾錯方法,其特征在于,所述對所述待糾錯字符的校驗值進行校驗,包括:
7.一種字符糾錯裝置,其特征在于,包括:
8.一種字符糾錯設備,其特征在于,包括處理器、存儲器以及存儲在所述存儲器中且被配置為由所述處理器執行的計算機程序,所述處理器在執行所述計算機程序時實現如權利要求1~6任一項所述的字符糾錯方法。
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質包括存儲的計算機程序;其中,所述計算機程序在運行時控制所述計
10.一種計算機程序產品,其特征在于,包括計算機程序/指令,該計算機程序/指令被處理器執行時實現如權利要求1~6任一項所述的字符糾錯方法。
...【技術特征摘要】
1.一種字符糾錯方法,其特征在于,包括:
2.如權利要求1所述的字符糾錯方法,其特征在于,所述根據若干所述第一相似度對所述待糾錯字符進行糾錯,包括:
3.如權利要求2所述的字符糾錯方法,其特征在于,所述預設第一相似度條件包括以下至少一項:
4.如權利要求3所述的字符糾錯方法,其特征在于,通過以下獲取所述預設相似度閾值:
5.如權利要求1所述的字符糾錯方法,其特征在于,所述則計算所述待糾錯字符分別與若干第一預設相似字符之間的第一相似度,包括:
6.如權利要求1所述的字符糾錯方法,其特征在于,所述對所述待糾錯字符的校驗值進行校驗,包括:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。