【技術實現步驟摘要】
本公開涉及圖像處理
,尤其涉及一種基于圖像的物體檢測方法、裝置及服務器。
技術介紹
物體檢測指的是對圖像中的物體進行檢測和識別,通過物體檢測能夠確定圖像拍攝的場景,從而為圖像分類提供依據,例如,包含辦公桌的圖像通常被歸類為辦公室圖像。相關技術中,通過SVM(SupportVectorMachine,支持向量機)對圖像中的物體進行檢測,從而得到圖像中的各類物體出現的概率。由于SVM的權重向量的個數較少,賦予SVM的學習能力有限,因而檢測精度不高,誤檢率和漏檢率較高。
技術實現思路
為克服相關技術中存在的問題,本公開提供了一種基于圖像的物體檢測方法、裝置及服務器。根據本公開實施例的第一方面,提供一種基于圖像的物體檢測方法,該方法可以包括:在一實施例中,對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;基于字典學習的方法對所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。在一實施例中,所述對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量,包括:遍歷所述圖像,確定包含圖像中的物體的多個窗口;確定各所述多個窗口中出現物體的概率;基于所述概率對所述多個窗口進行篩除處理,將剩下的窗口確定為目標窗口;識別所述目標窗口中的物體,確定所述物體的類別;確定每類物體在所述圖像中出現的次數,得到各類物體的頻次向量。在一實施例中,所述遍歷所述圖像,包括:通過滑動窗口的方式遍歷所述圖像。在一實施例中,所述對所述多個窗口進行篩除處理,包括:確定各所述多個窗口的概率是否低于設定概率閾值;將所述多個窗口中概率低于所述設定概率閾值的窗口確定為第一窗口;去除 ...
【技術保護點】
一種基于圖像的物體檢測方法,其特征在于,包括:對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;基于字典學習的方法對所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。
【技術特征摘要】
1.一種基于圖像的物體檢測方法,其特征在于,包括:對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;基于字典學習的方法對所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。2.根據權利要求1所述的方法,其特征在于,所述對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量,包括:遍歷所述圖像,確定包含圖像中的物體的多個窗口;確定各所述多個窗口中出現物體的概率;基于所述概率對所述多個窗口進行篩除處理,將剩下的窗口確定為目標窗口;識別所述目標窗口中的物體,確定所述物體的類別;確定每類物體在所述圖像中出現的次數,得到各類物體的頻次向量。3.根據權利要求2所述的方法,其特征在于,所述遍歷所述圖像,包括:通過滑動窗口的方式遍歷所述圖像。4.根據權利要求2所述的方法,其特征在于,所述對所述多個窗口進行篩除處理,包括:確定各所述多個窗口的概率是否低于設定概率閾值;將所述多個窗口中概率低于所述設定概率閾值的窗口確定為第一窗口;去除所述第一窗口。5.根據權利要求2所述的方法,其特征在于,所述對所述多個窗口進行篩除處理,包括:對于所述多個窗口中具有重合的兩個窗口,確定所述兩個窗口的交集面積和并集面積;計算所述交集面積和并集面積的比值;在所述比值大于設定比值閾值時,去除所述兩個窗口中概率較低的窗口,保留所述兩個窗口中概率較高的窗口;在所述比值不大于所述設定比值閾值時,保留所述兩個窗口。6.根據權利要求1所述的方法,其特征在于,所述基于字典學習的方法對所述頻次向量進行編碼,包括:確定用于表示至少兩類物體在圖像中同時出現的關聯性的字典值,所述字典值為常量;基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;計算使得第一值最小的編碼值。7.根據權利要求1所述的方法,其特征在于,所述基于字典學習的方法對所述頻次向量進行編碼,包括:確定用于表示至少兩類物體在圖像中同時出現的關聯性的字典值;基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;設定元參數;基于所述元參數和所述編碼值確定用于表示編碼值的稀疏以及用于調節所述編碼誤差的第二值;計算使得所述第一值和所述第二值的和最小的編碼值。8.根據權利要求7所述的方法,其特征在于,所述計算使得所述第一值和所述第二值的和最小的編碼值,包括:通過下式計算使得所述第一值和所述第二值的和最小的編碼值:minD,XΣi=1N||yi-Dxi||22+λ||xi||1]]>其中,為所述第一值,λ||xi||1為所述第二值,yi表示對第i個物體進行檢測的檢測結果,D表示用于表示至少兩類物體在圖像中同時出現的關聯性的字典值,xi表示與各個yi對應的編碼值,λ表示元參數。9.根據權利要求6-8任一項所述的方法,其特征在于,所述元參數的取值范圍包括10-3-103。10.一種基于圖像的物體檢測裝置,其特征在于,包括:檢測模塊,被配置為對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;編碼模塊,被配置為基于字典學習的方法對所述檢測模塊得到的所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。11.根據權利要求10所述的裝置,其特征在于,所述檢測模塊包...
【專利技術屬性】
技術研發人員:萬韶華,張旭華,楊松,
申請(專利權)人:北京小米移動軟件有限公司,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。