System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及光學字符識別,特別是涉及一種離線ocr識別方法、裝置、計算機設備和存儲介質。
技術介紹
1、隨著光學字符識別技術的發展,出現了ocr(optical?character?recognition,光學字符識別)識別技術,即,能夠將圖片或掃描件中的文字轉化為可編輯的文本的技術。
2、例如,在網約車的應用場景下,在網約車的注冊認證過程中通常會要求用戶上傳身份證、行駛證、駕駛證等相關資質資料。由于需要填寫的資料過多,而且過程過于繁瑣,如果要求用戶手動填入信息,首先用戶體驗不友好;其次手動填入存在概率性的誤差,用戶可能會輸入錯誤的信息,例如拼寫錯誤、數字錯誤等,導致后續流程出現問題;再者用戶可能會漏填,這都可能會導致后續業務流程無法正常進行或者出現延誤。因此,使用ocr技術進行自動識別和驗證,能夠提高信息錄入的準確性和效率。
3、然而,傳統方法中,網約車使用在線ocr識別技術,需要與服務器進行通信,因此對穩定的網絡連接有較高的依賴性。在網絡不穩定或者沒有網絡連接的情況下,無法進行ocr識別,影響用戶體驗。在線ocr識別技術需要將用戶上傳的圖像發送至服務器進行處理,可能涉及用戶的隱私信息,存在數據被泄露或濫用的風險,且在線ocr技術服務會對每個用戶設定配額或者限制,例如,每天最多識別的圖像數量、識別的圖像大小等,超出這些限制可能需要額外付費或者無法進行識別,這些都會導致ocr識別效率降低。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種能夠提高oc
2、第一方面,提供一種離線ocr識別方法,該方法包括:
3、在接收到啟用離線ocr識別的指令時,調用識別引擎判斷移動終端是否具有啟動離線ocr識別的權限,響應于具有啟動離線ocr識別的權限獲取注冊認證相關的待識別圖像;
4、調用加載至移動終端的離線ocr識別模型,對待識別圖像進行圖像識別以及文字識別;其中,離線ocr識別模型為對預先在機器學習平臺訓練的已訓練ocr識別模型進行壓縮和量化之后被集成至移動終端的模型;
5、響應于圖像識別以及文字識別成功,則將圖像識別以及文字識別的結果進行本地格式處理,以得到離線ocr識別結果。
6、在一些實施例中,已訓練ocr識別模型的訓練方法,包括:
7、使用輕量級骨干網絡并結合rnn模型構建待訓練ocr識別模型;
8、獲取樣本數據,樣本數據包括注冊認證相關的歷史圖像樣本,歷史圖像樣本中包括文字信息;
9、將樣本數據按照不同劃分策略劃分為訓練集和驗證集,不同的訓練集和驗證集的劃分策略,對待訓練ocr識別模型進行多次訓練,得到已訓練ocr識別模型。
10、在一些實施例中,該方法還包括:
11、在對待訓練ocr識別模型進行訓練的過程中,監測基于驗證集的待訓練ocr識別模型的輸出結果,根據輸出結果動態調整待訓練ocr識別模型的學習率。
12、在一些實施例中,該方法還包括:在對待訓練ocr識別模型進行訓練的過程中,監測基于驗證集的待訓練ocr識別模型的損失值,響應于驗證集的損失值在多個epoch內不再改善,則停止對待訓練ocr識別模型的訓練,得到訓練好的已訓練ocr識別模型。
13、在一些實施例中,對已訓練ocr識別模型進行壓縮的方法,包括:
14、將已訓練ocr識別模型作為教師模型為其定義對應的學生模型;
15、為學生模型定義蒸餾損失函數,并根據蒸餾損失函數計算教師模型的輸出與學生模型的輸出之間的差值;
16、調整學生模型的結構和容量以及蒸餾損失函數的蒸餾溫度參數,直至得到差值在預設范圍內且容量在預期范圍內的已蒸餾學生模型,將已蒸餾學習模型作為離線ocr識別模型。
17、在一些實施例中,對已訓練ocr識別模型進行量化的方法,包括:
18、將已蒸餾學生模型進行slim量化處理。
19、在一些實施例中,將已蒸餾學生模型進行slim量化處理,包括:
20、調用剪枝函數,通過amount參數配置剪枝函數的剪枝權重閾值,并根據剪枝權重閾值對已蒸餾學生模型進行基于權重的剪枝處理;
21、根據輸入數據的動態范圍來調整量化參數以對已蒸餾學生模型進行動態量化處理。
22、第二方面,提供一種離線ocr識別裝置,該裝置包括:
23、識別啟用模塊,用于在接收到啟用離線ocr識別的指令時,調用識別引擎判斷移動終端是否具有啟動離線ocr識別的權限,響應于具有啟動離線ocr識別的權限獲取注冊認證相關的待識別圖像;
24、離線識別模塊,用于調用加載至移動終端的離線ocr識別模型,對待識別圖像進行圖像識別以及文字識別;其中,離線ocr識別模型為對預先在機器學習平臺訓練的已訓練ocr識別模型進行壓縮和量化之后被集成至移動終端的模型;
25、本地處理模塊,用于響應于圖像識別以及文字識別成功,則將圖像識別以及文字識別的結果進行本地格式處理,以得到離線ocr識別結果。
26、第三方面,提供一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器執行計算機程序時實現上述第一方面的方法的步驟。
27、第四方面,提供一種計算機可讀存儲介質,其上存儲有計算機程序,計算機程序被處理器執行時實現上述第一方面的方法的步驟。
28、上述離線ocr識別方法、裝置、計算機設備和存儲介質,通過將已訓練ocr識別模型行壓縮和量化之后通過集成的方式加載至移動終端的系統內部,在啟動離線ocr識別后,通過調用加載至移動終端的離線ocr識別模型對待識別圖像進行識別,并進行本地化格式處理,從而能夠得到適配注冊認證的信息,由于不需要與服務器進行網絡通信,因此,第一,能夠減少注冊認證對于穩定網絡連接的依賴性;第二,由于例如網約車等注冊認證過程中,相關證件涉及用戶隱私數據,然而本方案的識別是在移動終端的本地進行離線識別,因此不需要將隱私數據上傳服務器,避免了用戶隱私數據被泄露或濫用的風險;第三,減少了注冊認證服務端的壓力,且不會因為注冊認證服務端對用戶設定配額或者限制識別次數而導致無法識別的情況的發生。
本文檔來自技高網...【技術保護點】
1.一種離線OCR識別方法,應用于移動終端,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述已訓練OCR識別模型的訓練方法,包括:
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
4.根據權利要求2所述的方法,其特征在于,所述方法還包括:在對所述待訓練OCR識別模型進行訓練的過程中,監測基于所述驗證集的所述待訓練OCR識別模型的損失值,響應于所述驗證集的損失值在多個epoch內不再改善,則停止對所述待訓練OCR識別模型的訓練,得到訓練好的所述已訓練OCR識別模型。
5.根據權利要求1所述的方法,其特征在于,對所述已訓練OCR識別模型進行壓縮的方法,包括:
6.根據權利要求5所述的方法,其特征在于,所述對所述已訓練OCR識別模型進行量化的方法,包括:
7.根據權利要求6所述的方法,其特征在于,所述將所述已蒸餾學生模型進行Slim量化處理,包括:
8.一種離線OCR識別裝置,其特征在于,所述裝置包括:
9.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的方法的步驟。
...【技術特征摘要】
1.一種離線ocr識別方法,應用于移動終端,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述已訓練ocr識別模型的訓練方法,包括:
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
4.根據權利要求2所述的方法,其特征在于,所述方法還包括:在對所述待訓練ocr識別模型進行訓練的過程中,監測基于所述驗證集的所述待訓練ocr識別模型的損失值,響應于所述驗證集的損失值在多個epoch內不再改善,則停止對所述待訓練ocr識別模型的訓練,得到訓練好的所述已訓練ocr識別模型。
5.根據權利要求1所述的方法,其特征在于,對所述已訓練ocr識別模型進行壓縮的方法...
【專利技術屬性】
技術研發人員:孫貝貝,
申請(專利權)人:北京白龍馬云行科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。