The invention discloses an image processing method and device, wherein the method comprises the following steps: obtaining input images; image feature extraction; feature are input to the prediction model, and according to the judgment whether the prediction model and prediction model of the relative pretreatment; if using pretreatment corresponding to the prediction model, the pretreatment of the picture, the picture identification OCR. This method improves the accuracy of OCR recognition by selecting the best combination of preprocessing methods from several preprocessing methods through multiple prediction models.
【技術實現步驟摘要】
圖片處理方法和裝置
本專利技術涉及圖片處理
,尤其涉及一種圖片處理方法和裝置。
技術介紹
光學字符識別(OpticalCharacterRecognition,OCR)是指通過圖像處理和模式識別技術對光學字符進行識別,并將光學字符翻譯成計算機文字的過程。通過OCR技術進行光學字符識別的圖片通常被稱為OCR圖片。為了能夠提高OCR識別結果的準確率,在進行OCR識別之前,通常要對圖片進行預處理。預處理方式的選擇直接影響OCR的識別結果。在同樣的識別算法下,預處理方式越合適,OCR識別結果的準確率也越高。現有的OCR圖片預處理技術,是對所有圖片均采用相同的預處理方式。然而,對于不同的圖片,可能一部分圖片經某一預處理方式處理后,會使OCR識別結果的準確率提高;而另一部分圖片經同樣的預處理方式處理后,可能會使OCR識別結果的準確率降低。因此,現有的OCR圖片預處理技術忽視了不同圖片特征對預處理方式的適用性,難以保證OCR識別結果的準確率。
技術實現思路
本專利技術旨在至少在一定程度上解決相關技術中的技術問題之一。為此,本專利技術的第一個目的在于提出一種圖片處理方法,該方法通過多個預測模型,從多個預處理方式中,選取最佳組合的預處理方式對圖片進行預處理,從而提高了OCR識別結果的準確率。本專利技術的第二個目的在于提出一種圖片處理裝置。為了實現上述目的,本專利技術第一方面實施例提出了一種圖片處理方法,包括:獲取輸入的圖片;提取圖片的特征;將特征依次輸入至多個預測模型中,并根據預測模型判斷是否采用與預測模型相對應的預處理方式;如果采用與預測模型相對應的預處理方式,則在對圖 ...
【技術保護點】
一種圖片處理方法,其特征在于,包括:獲取輸入的圖片;提取所述圖片的特征;將所述特征依次輸入至多個預測模型中,并根據所述預測模型判斷是否采用與所述預測模型相對應的預處理方式;如果采用與所述預測模型相對應的預處理方式,則在對所述圖片進行預處理后,對所述圖片進行OCR識別。
【技術特征摘要】
1.一種圖片處理方法,其特征在于,包括:獲取輸入的圖片;提取所述圖片的特征;將所述特征依次輸入至多個預測模型中,并根據所述預測模型判斷是否采用與所述預測模型相對應的預處理方式;如果采用與所述預測模型相對應的預處理方式,則在對所述圖片進行預處理后,對所述圖片進行OCR識別。2.如權利要求1所述的方法,其特征在于,所述特征包括形態學特征和紋理特征。3.如權利要求2所述的方法,其特征在于,所述形態學特征包括縱橫軸比、面稅凹凸比、周長凹凸比、球狀性、偏心率、圖片旋轉角度中的一種或多種。4.如權利要求2所述的方法,其特征在于,所述紋理特征包括梯度優勢、灰度分布、梯度分布、灰度平均、梯度平均、灰度均方差、梯度均方差中的一種或多種。5.如權利要求1所述的方法,其特征在于,所述預處理方式包括方向校正、梯形校正、除模糊處理、去除白噪音、銳化、調整對比度和陰影與亮度處理。6.如權利要求1所述的方法,其特征在于,在將所述特征輸入至預測模型中之前,還包括:訓練所述預測模型。7.如權利要求6所述的方法,其特征在于,訓練所述預測模型,包括:獲取圖片樣本;對所述圖片樣本采取相應的預處理方式,以獲得所述圖片樣本的預處理結果;分別對所述圖片樣本和所述預處理結果進行OCR分析,以獲得第一結果和第二結果;當所述第一結果優于所述第二結果時,則標注所述圖片樣本不采用所述預處理方式;當所述第二結果優于所述第一結果時,則標注所述圖片樣本采用所述預處理方式;將標注后的圖片樣本輸入至所述預測模型,以對所述預測模型進行訓練。8.如權利要求7所述的方法,其特征在于,將標注后的圖片樣本輸入至所述預測模型,以對所述預測模型進行訓練,包括:采用機器學習的方式,基于邏輯回歸或隨機森林對所述預測模型進行訓練。9.一種圖片處理裝置,其特征在于,包括:獲取模塊,用于獲...
【專利技術屬性】
技術研發人員:周列淳,岳智磊,劉泓,江巖,
申請(專利權)人:天方創新北京信息技術有限公司,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。