本申請公開了一種圖像識別方法及裝置,先對各樣本圖像的與指定色調匹配的圖像區(qū)域進行規(guī)范化處理,從而得到第一圖像集中的各圖像,然后通過該第一圖像集訓練該圖像分類器,以得到訓練完成的圖像分類器,將該待識別圖像輸入該訓練完成的圖像分類器中,得到針對該待識別圖像的識別結果。由于該第一圖像集中的圖像為對樣本圖像進行處理而得到的,使得該第一圖像集各圖像中與預設圖像類別匹配的圖像區(qū)域在該圖像中所占比例相對提升,在對該圖像進行縮放時減少圖像中與預設圖像類別匹配的圖像區(qū)域的信息損失,可見通過本申請?zhí)峁┑姆椒ǎ捎行У販p少第一圖像集中圖像的數(shù)量,在減少成本的同時也提高了該圖像分類器的訓練效率。
【技術實現(xiàn)步驟摘要】
本申請涉及信息
,尤其涉及一種圖像識別方法及裝置。
技術介紹
隨著信息化社會的發(fā)展以及網(wǎng)絡社交活動的增長,人們在進行網(wǎng)絡社交活動時更傾向于使用不受地域和語言限制的圖像取代文字作為傳詞達意的主要媒介,這使得網(wǎng)絡中圖像快速增加。如何利用網(wǎng)絡中的海量圖像就成為了近年來人們關注的熱點之一。由于圖像區(qū)別于文字信息,其內容無法直接通過關鍵字進行檢索、分類等操作,所以對于如何利用圖像來說,首先要解決的問題就是對圖像內容的識別,也即圖像識別技術。現(xiàn)有圖像識別技術主要采用機器學習的方法,具體的,首先需要人工對圖像進行分類,確定由不同內容的圖像分別構成的圖像集(如,風景圖像構成的圖像集、人臉圖像構成的圖像集、色情圖像構成的圖像集等等),之后針對每一種內容的圖像集,提取該圖像集包含的各圖像之間的共同特征(往往為特征向量),并通過訓練最終得到該圖像集的特征模型,最后根據(jù)各種圖像集分別對應的特征模型,對接收到的待識別圖像進行圖像識別,并確定該待識別圖像所屬類別。由于相對于人工設置并提取特征向量進行圖像識別,通過機器學習和訓練得到的特征模型避免了人的主觀因素的影響,并且可以通過訓練不斷優(yōu)化,所以使得圖像識別的準確率更高。但是,對于機器學習的方法來說,若想要圖像識別的準確率較高,首先需要大量的圖像用于學習和訓練不同內容的圖像集對應的特征模型,若是用于學習和訓練的圖像太少,則確定的特征模型的準確度就會降低,影響圖像識別的魯棒性,而訓練用的圖像太多,又會導致機器學習的方法的資源增加,影響機器學習的效率。其次,由于在于訓練特征模型時,對于用于訓練的圖像尺寸有統(tǒng)一要求(如,統(tǒng)一圖像尺寸為分辨率:100×100),所以還需要對用于訓練的圖像尺寸進行調整(包括:放大、縮小、拉伸等操作),如圖1所示,而導致圖像中包含的特征的損失,從而影響機器學習的準確性(即,影響最終得到的特征模型的準確性),使得為了保證機器學習的準確性需要進一步增加訓練用的圖像。圖1為對高分辨率圖像進行圖像縮放導致的圖像中包含的特征損失示意圖。其中,左側為原始尺寸大小的圖像,右側為縮小圖像尺寸之后的圖像,為了體現(xiàn)該縮小圖像尺寸之后的圖像中特征的損失,將該縮小圖像尺寸之后的圖像再次放大到該圖像的原始尺寸大小。可見,其中葉脈紋理已經(jīng)模糊,若以葉脈紋理為需要提取的特征的話,該縮小圖像尺寸之后的圖像的特征已經(jīng)出現(xiàn)了損失。可見由于上述問題,現(xiàn)有的圖像識別技術需要用于訓練的圖像數(shù)量較多,導致圖像識別的成本高。
技術實現(xiàn)思路
本申請實施例提供一種圖像識別方法,用于解決現(xiàn)有技術中,在采用機器學習的方法進行圖像識別時,需要大量用于訓練的圖像,導致圖像識別的成本增加的問題。本申請實施例提供一種圖像識別裝置,用于解決現(xiàn)有技術中,在采用機器學習的方法進行圖像識別時,需要大量用于訓練的圖像,導致圖像識別的成本增加的問題。本申請實施例采用下述技術方案:一種圖像識別方法,包括:確定待識別圖像;將所述待識別圖像輸入預先訓練完成的的圖像分類器,得到所述圖像分類器輸出的針對所述待識別圖像的識別結果,其中,所述圖像分類器進行訓練所用的第一圖像集中的圖像,是對樣本圖像中與指定色調匹配的圖像區(qū)域進行規(guī)范化處理而得到的;所述指定色調,根據(jù)預設圖像類別的圖像的色調確定。一種圖像識別裝置,包括:確定模塊,確定待識別圖像;識別模塊,將所述待識別圖像輸入預先訓練完成的圖像分類模塊,得到所述圖像分類器輸出的針對所述待識別圖像的識別結果,其中,所述圖像分類模塊進行訓練所用的第一圖像集中的圖像,是對樣本圖像中與指定色調匹配的圖像區(qū)域進行規(guī)范化處理而得到的;所述指定色調,根據(jù)預設圖像類別的圖像的色調確定。本申請實施例采用的上述至少一個技術方案能夠達到以下有益效果:先對各樣本圖像的與指定色調匹配的圖像區(qū)域進行規(guī)范化處理,從而得到第一圖像集中的各圖像,然后通過該第一圖像集訓練該圖像分類器,以得到訓練完成的圖像分類器,當對待識別圖像進行圖像識別時,將該待識別圖像輸入該訓練完成的該圖像分類器中,以得到該圖像分類器輸出的針對該待識別圖像的識別結果。其中,由于該第一圖像集中的圖像為對樣本圖像進行處理而得到的,使得該第一圖像集各圖像中與指定色調匹配的圖像區(qū)域在該圖像中所占比例相對提升,使得即使需要對該圖像進行縮放,也可減少圖像中與指定色調匹配的圖像區(qū)域的特征損失,增加了該圖像分類器的訓練結果的準確性,可見通過本申請?zhí)峁┑姆椒ǎ梢栽诓挥绊懹柧毿Ч那闆r下,有效地降低對第一圖像集中圖像的數(shù)量的需求,在減少成本的同時也提高了該圖像分類器的訓練效率。附圖說明此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:圖1為對高分辨率圖像進行圖像縮放導致的圖像中包含的特征損失示意圖;圖2為本申請實施例提供的圖像識別過程;圖3為本申請實施例提供的對該卷積神經(jīng)網(wǎng)絡模型進行訓練的過程;圖4為本申請實施例提供的確定該樣本圖像中與所述指定色調匹配的圖像區(qū)域,作為中間圖像的示意圖;圖5為本申請實施例提供的待訓練的卷積神經(jīng)網(wǎng)絡模型的結構示意圖;圖6是本申請實施例提供一種圖像識別裝置的結構示意圖。具體實施方式為使本申請的目的、技術方案和優(yōu)點更加清楚,下面將結合本申請具體實施例及相應的附圖對本申請技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。如前所述,由于采用機器學習的方法需要大量的用于訓練的圖像,并且在需要對用于訓練的圖像進行圖像尺寸統(tǒng)一的情況下,所需的圖像數(shù)量還需要進一步增加,所以導致現(xiàn)有技術中所需用于訓練的圖像數(shù)量大大增加。進一步地,由于采用機器學習的方法,實際上是訓練得到不同類的圖像分別對應的特征模型,所以在現(xiàn)有技術中還需要預先將用于訓練的圖像進行分類,才可根據(jù)預先分類過的圖像對特征模型進行調整,并最終得到圖像識別正確率符合要求的特征模型(即,對特征模型進行訓練的過程)。其中,預先對用于訓練的圖像進行分類通常依賴于人工進行,也就是說,需要由人工根據(jù)圖像的內容對用于訓練的圖像集中的各圖像進行分類。但是,由于現(xiàn)有技術需要用于訓練的圖像較多,所以需要大量的人工進行圖像分類工作,增加了運行成本。更進一步地,由于人工在對圖像進行分類時,主要依靠人的主觀感覺,在對于有些可以同時分類至不同類別的圖像,不同人對該圖像的分類結果可能并不一致,若通過這種可以同時分類至不同類別的圖像對特征模型進行訓練,則可能對訓練效果產(chǎn)生負面影響,但是由于現(xiàn)有技術需要用于訓練的圖像較多,要么增加人工對這種可以同時分類至不同類別的圖像進行篩查,排除出用于訓練的圖像集中,要么需要進一步增加用于訓練的圖像。基于以上內容,本申請實施例提供一種可以減少訓練用圖像,且不影響對特征模型訓練效果的用于圖像識別的技術方案。以下結合附圖,詳細說明本申請各實施例提供的技術方案。圖2為本申請實施例提供的圖像識別過程,具體包括以下步驟:S101:確定待識別圖像。在現(xiàn)有技術中,由于通常采用機器學習的方法訓練特征模型所消耗的資源較多,所以一般由服務器進行訓練該特征模型的本文檔來自技高網(wǎng)...
【技術保護點】
一種圖像識別方法,其特征在于,包括:確定待識別圖像;將所述待識別圖像輸入預先訓練完成的圖像分類器,得到所述圖像分類器輸出的針對所述待識別圖像的識別結果,其中,所述圖像分類器進行訓練所用的第一圖像集中的圖像,是對樣本圖像中與指定色調匹配的圖像區(qū)域進行規(guī)范化處理而得到的;所述指定色調,根據(jù)預設圖像類別的圖像的色調確定。
【技術特征摘要】
1.一種圖像識別方法,其特征在于,包括:確定待識別圖像;將所述待識別圖像輸入預先訓練完成的圖像分類器,得到所述圖像分類器輸出的針對所述待識別圖像的識別結果,其中,所述圖像分類器進行訓練所用的第一圖像集中的圖像,是對樣本圖像中與指定色調匹配的圖像區(qū)域進行規(guī)范化處理而得到的;所述指定色調,根據(jù)預設圖像類別的圖像的色調確定。2.如權利要求1所述的方法,其特征在于,所述第一圖像集,采用下述方法得到:確定由樣本圖像組成的第二圖像集;針對所述第二圖像集中的每一個樣本圖像,根據(jù)該樣本圖像的色調飽和度明度HSV顏色模型,確定該樣本圖像中與所述指定色調匹配的圖像區(qū)域;以及根據(jù)該樣本圖像中與所述指定色調匹配的圖像區(qū)域,確定與該樣本圖像對應的中間圖像;對所有中間圖像進行規(guī)范化處理;將所有進行規(guī)范化處理后的中間圖像的集合,作為所述第一圖像集。3.如權利要求1所述的方法,其特征在于,所述圖像分類器包括卷積神經(jīng)網(wǎng)絡模型。4.如權利要求3所述的方法,其特征在于,采用下述方式,訓練所述卷積神經(jīng)網(wǎng)絡模型:確定待訓練的卷積神經(jīng)網(wǎng)絡模型對應的各層初始化參數(shù);循環(huán)執(zhí)行下述步驟,直至所述待訓練的卷積神經(jīng)網(wǎng)絡模型模型輸出的誤差值達到第一閾值以及圖像識別正確率達到第二閾值為止,所述卷積神經(jīng)網(wǎng)絡模型訓練完成:將所述第一圖像集中的各圖像依次輸入所述待訓練的卷積神經(jīng)網(wǎng)絡模型,使得通過所述待訓練的卷積神經(jīng)網(wǎng)絡模型對輸入的各圖像的特征進行向前傳播至輸出層,計算輸出的所述誤差值以及所述圖像識別正確率,根據(jù)所述誤差值從輸出層以初始化參數(shù)為基礎反向調整所述待訓練的卷積神經(jīng)網(wǎng)絡模型中的各層對應的參數(shù)。5.如權利要求4所述的方法,其特征在于,所述卷...
【專利技術屬性】
技術研發(fā)人員:杜康華,王崇,任文越,
申請(專利權)人:微夢創(chuàng)科網(wǎng)絡科技中國有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。