• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    圖片處理方法和裝置制造方法及圖紙

    技術編號:15502104 閱讀:99 留言:0更新日期:2017-06-03 23:09
    本發明專利技術公開了一種圖片處理方法和裝置,其中,方法包括以下步驟:獲取輸入的圖片;提取圖片的特征;將特征依次輸入至多個預測模型中,并根據預測模型判斷是否采用與預測模型相對應的預處理方式;如果采用與預測模型相對應的預處理方式,則在對圖片進行預處理后,對圖片進行OCR識別。該方法通過多個預測模型,從多個預處理方式中,選取最佳組合的預處理方式對圖片進行預處理,從而提高了OCR識別結果的準確率。

    Picture processing method and apparatus

    The invention discloses an image processing method and device, wherein the method comprises the following steps: obtaining input images; image feature extraction; feature are input to the prediction model, and according to the judgment whether the prediction model and prediction model of the relative pretreatment; if using pretreatment corresponding to the prediction model, the pretreatment of the picture, the picture identification OCR. This method improves the accuracy of OCR recognition by selecting the best combination of preprocessing methods from several preprocessing methods through multiple prediction models.

    【技術實現步驟摘要】
    圖片處理方法和裝置
    本專利技術涉及圖片處理
    ,尤其涉及一種圖片處理方法和裝置。
    技術介紹
    光學字符識別(OpticalCharacterRecognition,OCR)是指通過圖像處理和模式識別技術對光學字符進行識別,并將光學字符翻譯成計算機文字的過程。通過OCR技術進行光學字符識別的圖片通常被稱為OCR圖片。為了能夠提高OCR識別結果的準確率,在進行OCR識別之前,通常要對圖片進行預處理。預處理方式的選擇直接影響OCR的識別結果。在同樣的識別算法下,預處理方式越合適,OCR識別結果的準確率也越高。現有的OCR圖片預處理技術,是對所有圖片均采用相同的預處理方式。然而,對于不同的圖片,可能一部分圖片經某一預處理方式處理后,會使OCR識別結果的準確率提高;而另一部分圖片經同樣的預處理方式處理后,可能會使OCR識別結果的準確率降低。因此,現有的OCR圖片預處理技術忽視了不同圖片特征對預處理方式的適用性,難以保證OCR識別結果的準確率。
    技術實現思路
    本專利技術旨在至少在一定程度上解決相關技術中的技術問題之一。為此,本專利技術的第一個目的在于提出一種圖片處理方法,該方法通過多個預測模型,從多個預處理方式中,選取最佳組合的預處理方式對圖片進行預處理,從而提高了OCR識別結果的準確率。本專利技術的第二個目的在于提出一種圖片處理裝置。為了實現上述目的,本專利技術第一方面實施例提出了一種圖片處理方法,包括:獲取輸入的圖片;提取圖片的特征;將特征依次輸入至多個預測模型中,并根據預測模型判斷是否采用與預測模型相對應的預處理方式;如果采用與預測模型相對應的預處理方式,則在對圖片進行預處理后,對圖片進行OCR識別。本專利技術實施例的圖片處理方法,通過將圖片的特征依次輸入多個預測模型中,判讀是否采用與預測模型相對應的預處理方式,如果采用與預測模型相對應的預處理方式,則在對圖片進行預處理后,對圖片進行OCR識別。該方法通過多個預測模型,從多個預處理方式中,選取最佳組合的預處理方式對圖片進行預處理,從而提高了OCR識別結果的準確率。為達上述目的,本專利技術第二方面實施例提出了一種圖片處理裝置,包括:獲取模塊,用于獲取輸入的圖片;提取模塊,用于提取圖片的特征;判斷模塊,用于將特征依次輸入至多個預測模型中,并根據預測模型判斷是否采用與預測模型相對應的預處理方式;處理模塊,用于如果采用與預測模型相對應的預處理方式,則在對圖片進行預處理后,對圖片進行OCR識別。本專利技術實施例的圖片處理裝置,通過將圖片的特征依次輸入多個預測模型中,判讀是否采用與預測模型相對應的預處理方式,如果采用與預測模型相對應的預處理方式,則在對圖片進行預處理后,對圖片進行OCR識別。該裝置通過多個預測模型,從多個預處理方式中,選取最佳組合的預處理方式對圖片進行預處理,從而提高了OCR識別結果的準確率。本專利技術附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術的實踐了解到。附圖說明圖1是根據本專利技術一個實施例的圖片處理方法的流程圖;圖2是根據本專利技術一個實施例的訓練預測模型的方法的流程圖;圖3是根據本專利技術一個實施例的圖片處理裝置的結構示意圖;圖4是根據本專利技術一個具體實施例的圖片處理裝置的結構示意圖。具體實施方式下面詳細描述本專利技術的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本專利技術,而不能理解為對本專利技術的限制。下面參考附圖描述本專利技術實施例的圖片處理方法和裝置。圖1是根據本專利技術一個實施例的圖片處理方法的流程圖。如圖1所示,該圖片處理方法包括:S101,獲取輸入的圖片。具體地,獲取需要進行OCR識別的圖片。例如,用戶在圖書館閱覽書籍時,發現某頁的內容自己比較喜歡,用手機拍下了該頁,并想通過OCR獲取圖片中的文字并進行編輯。因而,用戶拍下的這張照片可以作為輸入的圖片。S102,提取圖片的特征。具體地,在獲取輸入圖片后,提取圖片的特征。其中,圖片的特征包括形態學特征和紋理特征。其中,形態學特征包括縱橫軸比、面稅凹凸比、周長凹凸比、球狀性、偏心率、圖片旋轉角度中的一種或多種。紋理特征包括梯度優勢、灰度分布、梯度分布、灰度平均、梯度平均、灰度均方差、梯度均方差中的一種或多種。S103,將特征依次輸入至多個預測模型中,并根據預測模型判斷是否采用與預測模型相對應的預處理方式。其中,預測模型用于判斷是否采用與預測模型相對應的預處理方式。其中,預處理方式可包括方向校正、梯形校正、除模糊處理、去除白噪音、銳化、調整對比度和陰影與亮度處理等。需要理解的是,在本專利技術的實施例中,預測模型與預處理方式相對應。也就是說,每個預處理方式都有一個相對應的預測模型。例如,方向校正預處理方式有一個相對應的方向校正預測模型。其中,方向校正預測模型用于判斷是否對圖片采用方向校正預處理,以對圖片的方向進行校正。具體地,將提取的特征依次輸入至多個預測模型中,并根據預測模型判斷是否采用與預測模型相對應的預處理方式。舉例而言,可將提取的圖片的特征依次輸入至方向校正預測模型、梯形校正預測模型、除模糊處理預測模型、去除白噪音預測模型、銳化預測模型、調整對比度預測模型和陰影與亮度處理預測模型。通過這些預測模型判斷是否對圖片采用,與預測模型相對應的方向校正預處理、梯形校正預處理、除模糊處理、去除白噪音預處理、銳化處理、調整對比度預處理和陰影與亮度處理。也就是說,通過預測模型判斷出最佳的預處理組合方式。需要說明的是,對于圖片特征依次輸入至預測模型的順序,可根據實際需要進行設置,在此不作限定。此外,在將圖片的特征輸入至預測模型中之前,可對預測模型進行訓練。預測模型的訓練過程,如圖2所示,訓練步驟如下:S201,獲取圖片樣本。具體地,獲取大量的、可用于OCR識別的圖片樣本。S202,對圖片樣本采取相應的預處理方式,以獲得圖片樣本的預處理結果。獲取圖片樣本后,對圖片樣本采取相應的預處理方式,以獲得圖片樣本的預處理結果。其中,預處理方式可包括但不限于,方向校正、梯形校正、除模糊處理、去除白噪音、銳化、調整對比度和陰影與亮度處理等。S203,分別對圖片樣本和預處理后的圖片樣本進行OCR分析,以獲得第一結果和第二結果。在獲取圖片樣本的預處理結果后,分別對圖片樣本和相應的預處理后的圖片樣本進行OCR分析,以獲得第一結果和第二結果。其中,第一結果是對圖片樣本進行OCR分析獲得的結果,第二結果是對預處理后的圖片樣本進行OCR分析獲得的結果。例如,在訓練方向校正預測模型時,第一結果是對圖片樣本直接進行OCR分析獲得的結果,第二結果是對經過方向校正預處理后的圖片,進行OCR分析獲得的結果。S204,比較第一結果和第二結果,判斷是否對圖片樣本進行標注。具體地,比較第一結果和第二結果。當第一結果優于第二結果時,標注圖片樣本不采用該預處理方式。當第二結果優于第一結果時,標注圖片樣本采用該預處理方式。也就是說,當不采用該預處理方式的OCR分析結果優于采用該處理方式的OCR分析結果時,標注圖片樣本不采用該預處理方式;當采用該處理方式的OCR分析結果優于不采用該預處理方式的OCR分析結果時,標注圖片樣本采用該預處理方式。S205,將本文檔來自技高網...
    圖片處理方法和裝置

    【技術保護點】
    一種圖片處理方法,其特征在于,包括:獲取輸入的圖片;提取所述圖片的特征;將所述特征依次輸入至多個預測模型中,并根據所述預測模型判斷是否采用與所述預測模型相對應的預處理方式;如果采用與所述預測模型相對應的預處理方式,則在對所述圖片進行預處理后,對所述圖片進行OCR識別。

    【技術特征摘要】
    1.一種圖片處理方法,其特征在于,包括:獲取輸入的圖片;提取所述圖片的特征;將所述特征依次輸入至多個預測模型中,并根據所述預測模型判斷是否采用與所述預測模型相對應的預處理方式;如果采用與所述預測模型相對應的預處理方式,則在對所述圖片進行預處理后,對所述圖片進行OCR識別。2.如權利要求1所述的方法,其特征在于,所述特征包括形態學特征和紋理特征。3.如權利要求2所述的方法,其特征在于,所述形態學特征包括縱橫軸比、面稅凹凸比、周長凹凸比、球狀性、偏心率、圖片旋轉角度中的一種或多種。4.如權利要求2所述的方法,其特征在于,所述紋理特征包括梯度優勢、灰度分布、梯度分布、灰度平均、梯度平均、灰度均方差、梯度均方差中的一種或多種。5.如權利要求1所述的方法,其特征在于,所述預處理方式包括方向校正、梯形校正、除模糊處理、去除白噪音、銳化、調整對比度和陰影與亮度處理。6.如權利要求1所述的方法,其特征在于,在將所述特征輸入至預測模型中之前,還包括:訓練所述預測模型。7.如權利要求6所述的方法,其特征在于,訓練所述預測模型,包括:獲取圖片樣本;對所述圖片樣本采取相應的預處理方式,以獲得所述圖片樣本的預處理結果;分別對所述圖片樣本和所述預處理結果進行OCR分析,以獲得第一結果和第二結果;當所述第一結果優于所述第二結果時,則標注所述圖片樣本不采用所述預處理方式;當所述第二結果優于所述第一結果時,則標注所述圖片樣本采用所述預處理方式;將標注后的圖片樣本輸入至所述預測模型,以對所述預測模型進行訓練。8.如權利要求7所述的方法,其特征在于,將標注后的圖片樣本輸入至所述預測模型,以對所述預測模型進行訓練,包括:采用機器學習的方式,基于邏輯回歸或隨機森林對所述預測模型進行訓練。9.一種圖片處理裝置,其特征在于,包括:獲取模塊,用于獲...

    【專利技術屬性】
    技術研發人員:周列淳岳智磊劉泓江巖
    申請(專利權)人:天方創新北京信息技術有限公司
    類型:發明
    國別省市:北京,11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV无码一区二区三区电影 | 人妻少妇精品无码专区二区 | 中文字幕人成无码免费视频| 久久精品aⅴ无码中文字字幕重口 久久精品国产亚洲AV无码娇色 | 精品久久久无码中文字幕边打电话 | 久久精品无码专区免费青青| 无码中文字幕乱码一区| 国产精品毛片无码| 中文字幕日产无码| 亚洲AV日韩AV永久无码下载| 国产成人无码精品一区不卡| 18禁无遮挡无码国产免费网站| 人妻系列AV无码专区| 亚洲av永久无码精品网址| 亚洲AV人无码综合在线观看 | 中文有码vs无码人妻| 国产精品成人99一区无码| 亚洲youwu永久无码精品| 亚洲精品无码不卡| 亚洲国产精品无码久久久秋霞2| 日韩加勒比一本无码精品| 一区二区三区无码被窝影院| 亚洲AV无码专区电影在线观看| 人妻丰满熟妇aⅴ无码| 人妻老妇乱子伦精品无码专区| 无码av免费一区二区三区试看| 国产精品无码午夜福利| 亚洲精品无码AV人在线播放 | 免费无码肉片在线观看| 无码国内精品久久综合88| 亚洲国产精品无码久久久| 久久精品无码一区二区WWW| 日韩av无码中文字幕| 激情无码人妻又粗又大中国人 | 亚洲精品无码成人片在线观看 | 亚洲精品无码久久久久去q| 日韩人妻无码一区二区三区综合部| 亚洲精品无码av天堂| 亚洲欧洲日产国码无码网站| 无码人妻久久一区二区三区免费| 亚洲一区二区三区无码中文字幕|