System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及數據處理,特別涉及一種非標準版式資料智能處理方法、裝置、終端及介質。
技術介紹
1、目前銀行房貸資料審核流程一般是前臺客戶經理填寫資料,通過人眼識別錄入到銀行系統中,后臺有大量錄入崗人員對相關信息進行審核,最后評估風險實現房貸,由于客戶經理需要耗費大量時間處理相關資料數據的錄入,勞動重復度高,錯誤率較高,影像客戶體驗,影響客戶經理為客戶提供更優質的服務。
技術實現思路
1、本申請旨在至少解決現有技術中存在的技術問題之一。為此,本申請提出一種非標準版式資料智能處理方法、裝置、終端及介質,能夠大大縮減了工作時間,能夠給客戶提供更優質的服務。
2、第一方面,本申請實施例提供了一種非標準版式資料智能處理方法,所述方法包括:
3、獲取目標錄入文件,所述目標錄入文件為在對多個紙質掃描圖像中通過第一識別處理得到的第一分類類別集中的第一分類類別,與預設分類類別集中的第二分類類別進行匹配處理所得到錄入文件;
4、基于預設匹配條件根據所述目標錄入文件的所述第一分類類別的第一子分類所對應的第一數據、所述第一分類類別的第二子分類、系統審批表中第三分類類別、所述第三分類類別所對應的第二數據進行匹配處理,確定所述目標錄入文件與所述第二數據的第一對應關系,所述第一子分類與所述第二子分類不同;
5、對所述目標錄入文件中的第二子分類類別進行第二識別處理,得到所需要提取的所述第二子分類類別中的文字內容;
6、通過rpa根據所述第二子分類類別、所述第
7、在一些可選的實施例中,所述對多個所述紙質掃描圖像進行第一識別處理,包括:
8、獲取多個紙質掃描圖像,所述紙質掃描圖像包括第一圖像、第二圖像和第三圖像,所述第一圖像為只有打印文字的文本圖像,所述第二圖像為只有手寫文字的文本圖像,所述第三圖像為打印文字和手寫文字的混合文本圖像;
9、對所述紙質掃描圖像進行文字識別處理,得到第一分類類別集;
10、在所述第一分類類別集中的第一分類類別與預設的目標分類類別集中的第二分類類別不完全對應的情況下,得到第一差異分類類別;
11、根據所述第一分類類別對所述掃描圖像的所有文字進行區域劃分處理,得到第一區域和第二區域,所述第一區域為所述第一分類類別對應的區域,所述第二區域為非所述第一分類類別對應的區域;
12、對所述第二區域中的文字進行拆分處理得到拆分后的字形,并對所述拆分后的字形進行識別得到第二識別結果;
13、將所述第二識別結果中所識別得到的分類類別與所述第一差異分類類別進行匹配處理,得到第一匹配結果;
14、在所述第一匹配結果為完全匹配的情況下,將所述紙質掃描圖像確定為目標錄入文件。
15、在一些可選的實施例中,所述方法還包括:
16、在所述第一匹配結果為不完全匹配的情況下,將所述紙質掃描圖像確定為候選錄入文件;
17、在所述通過rpa根據所述第二子分類類別、所述第二子分類類別中的文字內容以及所述第三分類類別將所述文字內容進行錄入處理之后,對所述候選錄入文件與所述系統審批表中的剩余未錄入的用戶數據進行匹配處理,確定為目標錄入文件。
18、在一些可選的實施例中,所述基于預設匹配條件根據所述目標錄入文件的所述第一分類類別的第一子分類所對應的第一數據、所述第一分類類別的第二子分類、系統審批表的所述第三分類類別所對應的第二數據進行匹配處理,確定所述目標錄入文件與所述第二數據的第一對應關系,包括:
19、根據所述目標錄入文件的所述第一分類類別的第一子分類類別所對應的第一數據與所述第三分類類別所對應的第二數據進行匹配處理;
20、在與所述第二數據匹配的所述目標錄入文件存在多個的情況下,將所述第二子分類與所述第二分類類別的子分類進行匹配處理,得到匹配處理結果,包括:
21、根據所述匹配處理結果確定所述目標錄入文件與所述第二數據的第一對應關系。
22、在一些可選的實施例中,所述第一子分類類別包括第一子類別和第二子類別,所述第三分類類別包括第一子類別和第二子類別,所述根據所述目標錄入文件的所述第一分類類別的第一子分類類別所對應的第一數據與所述第三分類類別所對應的第二數據進行匹配處理;
23、基于編輯距離算法對第一子類別的第一數據和所述第三分類類別的第一子類別中的第二數據進行匹配處理,得到第一子類別數據匹配結果;
24、在所述第一子類別數據匹配結果為符合匹配所對應的目標錄入文件為多個的情況下,基于相似度算法對第二子類別的第一數據和所述第三分類類別的第二子類別中的第二數據進行匹配處理。
25、在一些可選的實施例中,所述對所述目標錄入文件中的第二子分類類別進行第二識別處理,得到所述第二子分類類別中的文字內容,包括:
26、根據所述目標錄入文件中的第二子分類類別確定目標識別算法;
27、根據所述目標識別算法對所述第二子分類類別所對應的第三區域進行第二識別處理,得到所述第二子分類類別中的文字內容,所述第三區域根據所述第二子分類類別進行劃定。
28、在一些可選的實施例中,所述第二子分類類別包括第三子類別,所述第三子類別對應的目標識別算法為第一識別算法,所述根據所述目標識別算法對所述第二子分類類別對應的文字內容進行第二識別處理,得到所需要提取的所述第二子分類類別中的文字內容,包括:
29、通過所述第一識別算法對所述第二子分類類別的所述第三子類別所對應的文字內容進行識別,得到第一識別文字;
30、根據所述第一識別文字與第一識別算法中的第一預設字段值進行匹配;
31、在無法匹配到所述預設字段值的情況下,根據所述第二預設字段值對所述第一識別文字進行第一文字提取,得到第一提取文字;
32、根據第一預設排列規則對所述第一提取文字進行排列處理,得到排列處理后的第一排列文字;
33、根據所述第一排列文字確定所去需要提取的所述第二子分類類別的第三子類別的文字內容。
34、在一些可選的實施例中,所述根據第一預設排列規則對所述第一提取文字進行排列處理,得到排列處理后的第一排列文字,包括:
35、根據第一預設排列規則對所述第一提取文字進行匹配處理,得到所述第一提取文字中的排列位置最前的排列文字;
36、在所述第一提取文字中的排列位置最前的排列文字非所述第一預設排列規則中最前的文字的情況下,對所述第一提取文字進行預設的近似字匹配處理,得到近似字匹配結果;
37、在所述近似字匹配結果為匹配成功的情況下,將所有根據所述第一預設排列規則匹配得到的所有文字進行排列處理,得到排列處理后的第一排列文字。
38、在一些可選的實施例中,所述第二子分類類別包括第四子類別,所述第四子類別對應的目標識別算法為第二識別算法本文檔來自技高網...
【技術保護點】
1.一種非標準版式資料智能處理方法,其特征在于,所述方法包括:
2.根據權利要求1所述非標準版式資料智能處理方法,其特征在于,對多個所述紙質掃描圖像進行第一識別處理,包括:
3.根據權利要求2所述非標準版式資料智能處理方法,其特征在于,所述方法還包括:
4.根據權利要求1所述非標準版式資料智能處理方法,其特征在于,所述基于預設匹配條件根據所述目標錄入文件的所述第一分類類別的第一子分類所對應的第一數據、所述第一分類類別的第二子分類、系統審批表的所述第三分類類別所對應的第二數據進行匹配處理,確定所述目標錄入文件與所述第二數據的第一對應關系,包括:
5.根據權利要求4所述非標準版式資料智能處理方法,其特征在于,所述第一子分類類別包括第一子類別和第二子類別,所述第三分類類別包括第一子類別和第二子類別,所述根據所述目標錄入文件的所述第一分類類別的第一子分類類別所對應的第一數據與所述第三分類類別所對應的第二數據進行匹配處理,包括:
6.根據權利要求1所述非標準版式資料智能處理方法,其特征在于,所述對所述目標錄入文件中的第二子分類類別
7.根據權利要求6所述非標準版式資料智能處理方法,其特征在于,所述第二子分類類別包括第三子類別,所述第三子類別對應的目標識別算法為第一識別算法,所述根據所述目標識別算法對所述第二子分類類別對應的文字內容進行第二識別處理,得到所需要提取的所述第二子分類類別中的文字內容,包括:
8.根據權利要求7所述的非標準版式資料智能處理方法,其特征在于,所述根據第一預設排列規則對所述第一提取文字進行排列處理,得到排列處理后的第一排列文字,包括:
9.根據權利要求6所述的非標準版式資料智能處理方法,其特征在于,所述第二子分類類別包括第四子類別,所述第四子類別對應的目標識別算法為第二識別算法,所述根據所述目標識別算法對所述第二子分類類別對應的文字內容進行第二識別處理,得到所需要提取的所述第二子分類類別中的文字內容,包括:
10.根據權利要求6所述的非標準版式資料智能處理方法,其特征在于,所述第二子分類類別包括第五子類別,所述第五子類別對應的目標識別算法為第三識別算法,所述根據所述目標識別算法對所述第二子分類類別對應的文字內容進行第三識別處理,得到所需要提取的所述第二子分類類別中的文字內容,包括:
11.一種非標準版式資料智能處理裝置,其特征在于,包括:
12.一種終端,其特征在于,包括至少一個控制處理器和用于與所述至少一個控制處理器通信連接的存儲器;所述存儲器存儲有可被所述至少一個控制處理器執行的指令,所述指令被所述至少一個控制處理器執行,以使所述至少一個控制處理器能夠執行如權利要求1至10任一項所述的非標準版式資料智能處理方法。
13.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機可執行指令,所述計算機可執行指令用于使計算機執行如權利要求1至10任一項所述的非標準版式資料智能處理方法。
...【技術特征摘要】
1.一種非標準版式資料智能處理方法,其特征在于,所述方法包括:
2.根據權利要求1所述非標準版式資料智能處理方法,其特征在于,對多個所述紙質掃描圖像進行第一識別處理,包括:
3.根據權利要求2所述非標準版式資料智能處理方法,其特征在于,所述方法還包括:
4.根據權利要求1所述非標準版式資料智能處理方法,其特征在于,所述基于預設匹配條件根據所述目標錄入文件的所述第一分類類別的第一子分類所對應的第一數據、所述第一分類類別的第二子分類、系統審批表的所述第三分類類別所對應的第二數據進行匹配處理,確定所述目標錄入文件與所述第二數據的第一對應關系,包括:
5.根據權利要求4所述非標準版式資料智能處理方法,其特征在于,所述第一子分類類別包括第一子類別和第二子類別,所述第三分類類別包括第一子類別和第二子類別,所述根據所述目標錄入文件的所述第一分類類別的第一子分類類別所對應的第一數據與所述第三分類類別所對應的第二數據進行匹配處理,包括:
6.根據權利要求1所述非標準版式資料智能處理方法,其特征在于,所述對所述目標錄入文件中的第二子分類類別進行第二識別處理,得到所述第二子分類類別中的文字內容,包括:
7.根據權利要求6所述非標準版式資料智能處理方法,其特征在于,所述第二子分類類別包括第三子類別,所述第三子類別對應的目標識別算法為第一識別算法,所述根據所述目標識別算法對所述第二子分類類別對應的文字內容進行第二識別處理,得到所需要提取的所述第二子分類類別中的文...
【專利技術屬性】
技術研發人員:龔南書,徐峰,吳令,謝淏,張貽梟,陳萬毅,曲英巍,周光強,石虎,陳玲,賈鏡楊,呂齊立亞,
申請(專利權)人:重慶銀行股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。