• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于圖像的物體檢測方法、裝置及服務器制造方法及圖紙

    技術編號:14756390 閱讀:132 留言:0更新日期:2017-03-02 22:57
    本公開是關于基于圖像的物體檢測方法、裝置及服務器,該方法包括:對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;基于字典學習的方法對所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。應用本公開實施例,與相關技術中直接將物體在圖像中出現的頻率作為檢測結果所不同的是,通過字典學習的方法,獲取圖像中各個物體的頻次向量,并利用編碼對以頻次向量所表示的檢測結果進行修正,從而降低誤檢率和漏檢率,提高檢測準確率和完整性。

    【技術實現步驟摘要】

    本公開涉及圖像處理
    ,尤其涉及一種基于圖像的物體檢測方法、裝置及服務器
    技術介紹
    物體檢測指的是對圖像中的物體進行檢測和識別,通過物體檢測能夠確定圖像拍攝的場景,從而為圖像分類提供依據,例如,包含辦公桌的圖像通常被歸類為辦公室圖像。相關技術中,通過SVM(SupportVectorMachine,支持向量機)對圖像中的物體進行檢測,從而得到圖像中的各類物體出現的概率。由于SVM的權重向量的個數較少,賦予SVM的學習能力有限,因而檢測精度不高,誤檢率和漏檢率較高。
    技術實現思路
    為克服相關技術中存在的問題,本公開提供了一種基于圖像的物體檢測方法、裝置及服務器。根據本公開實施例的第一方面,提供一種基于圖像的物體檢測方法,該方法可以包括:在一實施例中,對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;基于字典學習的方法對所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。在一實施例中,所述對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量,包括:遍歷所述圖像,確定包含圖像中的物體的多個窗口;確定各所述多個窗口中出現物體的概率;基于所述概率對所述多個窗口進行篩除處理,將剩下的窗口確定為目標窗口;識別所述目標窗口中的物體,確定所述物體的類別;確定每類物體在所述圖像中出現的次數,得到各類物體的頻次向量。在一實施例中,所述遍歷所述圖像,包括:通過滑動窗口的方式遍歷所述圖像。在一實施例中,所述對所述多個窗口進行篩除處理,包括:確定各所述多個窗口的概率是否低于設定概率閾值;將所述多個窗口中概率低于所述設定概率閾值的窗口確定為第一窗口;去除所述第一窗口。在一實施例中,所述對所述多個窗口進行篩除處理,包括:對于所述多個窗口中具有重合的兩個窗口,確定所述兩個窗口的交集面積和并集面積;計算所述交集面積和并集面積的比值;在所述比值大于設定比值閾值時,去除所述兩個窗口中概率較低的窗口,保留所述兩個窗口中概率較高的窗口;在所述比值不大于所述設定比值閾值時,保留所述兩個窗口。在一實施例中,所述基于字典學習的方法對所述頻次向量進行編碼,包括:確定用于表示至少兩類物體在圖像中同時出現的關聯性的字典值,所述字典值為常量;基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;計算使得第一值最小的編碼值。在一實施例中,所述基于字典學習的方法對所述頻次向量進行編碼,包括:確定用于表示至少兩類物體在圖像中同時出現的關聯性的字典值;基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;設定元參數;基于所述元參數和所述編碼值確定用于表示編碼值的稀疏以及用于調節所述編碼誤差的第二值;計算使得所述第一值和所述第二值的和最小的編碼值。在一實施例中,所述計算使得所述第一值和所述第二值的和最小的編碼值,包括:通過下式計算使得所述第一值和所述第二值的和最小的編碼值:其中,為所述第一值,λ||xi||1為所述第二值,yi表示對第i個物體進行檢測的檢測結果,D表示用于表示至少兩類物體在圖像中同時出現的關聯性的字典值,xi表示與各個yi對應的編碼值,λ表示元參數。在一實施例中,所述元參數的取值范圍包括10-3-103。根據本公開實施例的第二方面,提供一種基于圖像的物體檢測裝置,包括:檢測模塊,被配置為對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;編碼模塊,被配置為基于字典學習的方法對所述檢測模塊得到的所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。在一實施例中,所述檢測模塊包括:遍歷子模塊,被配置為遍歷所述圖像,確定包含圖像中的物體的多個窗口;第一確定子模塊,被配置為確定各所述多個窗口中出現物體的概率;處理子模塊,被配置為基于所述概率對所述多個窗口進行篩除處理,將剩下的窗口確定為目標窗口;識別子模塊,被配置為識別所述目標窗口中的物體,確定所述物體的類別;第二確定子模塊,被配置為確定每類物體在所述圖像中出現的次數,得到各類物體的頻次向量。在一實施例中,所述遍歷子模塊包括:第一遍歷子模塊,被配置為通過滑動窗口的方式遍歷所述圖像。在一實施例中,所述處理子模塊包括:第三確定子模塊,被配置為確定各所述多個窗口的概率是否低于設定概率閾值;第四確定子模塊,被配置為將所述多個窗口中概率低于所述設定概率閾值的窗口確定為第一窗口;第一去除子模塊,被配置為去除所述第一窗口。在一實施例中,所述處理子模塊包括:第五確定子模塊,被配置為對于所述多個窗口中具有重合的兩個窗口,確定所述兩個窗口的交集面積和并集面積;第一計算子模塊,被配置為計算所述交集面積和并集面積的比值;第二去除子模塊,被配置為在所述比值大于設定比值閾值時,去除所述兩個窗口中概率較低的窗口,保留所述兩個窗口中概率較高的窗口;保留子模塊,被配置為在所述比值不大于所述設定比值閾值時,保留所述兩個窗口。在一實施例中,所述編碼模塊包括:第六確定子模塊,被配置為確定用于表示至少兩類物體在圖像中同時出現的關聯性的字典值,所述字典值為常量;第七確定子模塊,被配置為基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;第二計算子模塊,被配置為計算使得第一值最小的編碼值。在一實施例中,所述編碼模塊包括:第八確定子模塊,被配置為確定用于表示至少兩類物體在圖像中同時出現的關聯性的字典值;第九確定子模塊,被配置為基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;設定子模塊,被配置為設定元參數;第十確定子模塊,被配置為基于所述元參數和所述編碼值確定用于表示編碼值的稀疏以及用于調節所述編碼誤差的第二值;第三計算子模塊,被配置為計算使得所述第一值和所述第二值的和最小的編碼值。在一實施例中,所述第三計算子模塊通過下式計算使得所述第一值和所述第二值的和最小的編碼值:其中,為所述第一值,λ||xi||1為所述第二值,yi表示對第i個物體進行檢測的檢測結果,D表示用于表示至少兩類物體在圖像中同時出現的關聯性的字典值,xi表示與各個yi對應的編碼值,λ表示元參數。在一實施例中,所述元參數的取值范圍包括10-3-103。根據本公開實施例的第三方面,提供一種服務器,包括:處理器;用于存儲處理器可執行指令的存儲器;其中,所述處理器被配置為:對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;基于字典學習的方法對所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。本公開的實施例提供的技術方案可以包括以下有益效果:本公開中與相關技術中直接將物體在圖像中出現的頻率作為檢測結果所不同的是,服務器可以通過字典學習的方法,獲取圖像中各個物體的頻次向量,并利用編碼對以頻次向量所表示的檢測結果進行修正,從而降低誤檢率和漏檢率,提高檢測準確率和完整性。應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本公開。附圖說明此處的附圖被并入說明書中并構成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。圖1是本公開根據一示例性實施例示出的一種基于圖像的物體檢測方法流程圖。圖2A是本公開根據一示例性實施例示出的另一種基于圖像的物體檢測方法流程圖。圖2B是本公開根據本文檔來自技高網...
    基于圖像的物體檢測方法、裝置及服務器

    【技術保護點】
    一種基于圖像的物體檢測方法,其特征在于,包括:對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;基于字典學習的方法對所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。

    【技術特征摘要】
    1.一種基于圖像的物體檢測方法,其特征在于,包括:對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;基于字典學習的方法對所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。2.根據權利要求1所述的方法,其特征在于,所述對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量,包括:遍歷所述圖像,確定包含圖像中的物體的多個窗口;確定各所述多個窗口中出現物體的概率;基于所述概率對所述多個窗口進行篩除處理,將剩下的窗口確定為目標窗口;識別所述目標窗口中的物體,確定所述物體的類別;確定每類物體在所述圖像中出現的次數,得到各類物體的頻次向量。3.根據權利要求2所述的方法,其特征在于,所述遍歷所述圖像,包括:通過滑動窗口的方式遍歷所述圖像。4.根據權利要求2所述的方法,其特征在于,所述對所述多個窗口進行篩除處理,包括:確定各所述多個窗口的概率是否低于設定概率閾值;將所述多個窗口中概率低于所述設定概率閾值的窗口確定為第一窗口;去除所述第一窗口。5.根據權利要求2所述的方法,其特征在于,所述對所述多個窗口進行篩除處理,包括:對于所述多個窗口中具有重合的兩個窗口,確定所述兩個窗口的交集面積和并集面積;計算所述交集面積和并集面積的比值;在所述比值大于設定比值閾值時,去除所述兩個窗口中概率較低的窗口,保留所述兩個窗口中概率較高的窗口;在所述比值不大于所述設定比值閾值時,保留所述兩個窗口。6.根據權利要求1所述的方法,其特征在于,所述基于字典學習的方法對所述頻次向量進行編碼,包括:確定用于表示至少兩類物體在圖像中同時出現的關聯性的字典值,所述字典值為常量;基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;計算使得第一值最小的編碼值。7.根據權利要求1所述的方法,其特征在于,所述基于字典學習的方法對所述頻次向量進行編碼,包括:確定用于表示至少兩類物體在圖像中同時出現的關聯性的字典值;基于所述字典值、所述頻次向量以及所述編碼的編碼值確定用于表示編碼誤差的第一值;設定元參數;基于所述元參數和所述編碼值確定用于表示編碼值的稀疏以及用于調節所述編碼誤差的第二值;計算使得所述第一值和所述第二值的和最小的編碼值。8.根據權利要求7所述的方法,其特征在于,所述計算使得所述第一值和所述第二值的和最小的編碼值,包括:通過下式計算使得所述第一值和所述第二值的和最小的編碼值:minD,XΣi=1N||yi-Dxi||22+λ||xi||1]]>其中,為所述第一值,λ||xi||1為所述第二值,yi表示對第i個物體進行檢測的檢測結果,D表示用于表示至少兩類物體在圖像中同時出現的關聯性的字典值,xi表示與各個yi對應的編碼值,λ表示元參數。9.根據權利要求6-8任一項所述的方法,其特征在于,所述元參數的取值范圍包括10-3-103。10.一種基于圖像的物體檢測裝置,其特征在于,包括:檢測模塊,被配置為對圖像中的物體進行檢測,得到所述圖像中包含的各類物體的頻次向量;編碼模塊,被配置為基于字典學習的方法對所述檢測模塊得到的所述頻次向量進行編碼,將得到的編碼值作為物體檢測的結果。11.根據權利要求10所述的裝置,其特征在于,所述檢測模塊包...

    【專利技術屬性】
    技術研發人員:萬韶華張旭華楊松
    申請(專利權)人:北京小米移動軟件有限公司
    類型:發明
    國別省市:北京;11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产精品无码DVD在线观看| 黄色成人网站免费无码av| 亚洲国产精品成人精品无码区| 国精无码欧精品亚洲一区| 久久无码AV一区二区三区| 亚洲AV无码成人精品区大在线| 久久久久精品国产亚洲AV无码| 免费a级毛片无码a∨性按摩| 久久久久久AV无码免费网站 | 免费无码专区毛片高潮喷水| 亚洲AV综合色区无码一区| 精品无码一区二区三区水蜜桃| 欧洲成人午夜精品无码区久久| 国产亚洲?V无码?V男人的天堂 | 亚洲一区二区三区无码中文字幕| 亚洲最大天堂无码精品区| 国产做无码视频在线观看浪潮| 无码喷水一区二区浪潮AV| 精品多人p群无码| 无码超乳爆乳中文字幕久久| 亚洲精品无码高潮喷水在线| 无码的免费不卡毛片视频| 无码人妻久久一区二区三区免费丨 | 成年无码av片在线| 午夜无码一区二区三区在线观看| 亚洲日韩看片无码电影| av无码久久久久不卡免费网站| 无码午夜人妻一区二区三区不卡视频 | 无码人妻少妇久久中文字幕 | 精品久久久久久无码人妻| 无码成人精品区在线观看| 亚洲AV无码国产在丝袜线观看| 久久午夜无码鲁丝片午夜精品| 亚洲无码高清在线观看| 亚洲中久无码不卡永久在线观看| 无码A级毛片日韩精品| 西西4444www大胆无码| 国产精品无码午夜福利| 无码精品国产一区二区三区免费| 蜜桃成人无码区免费视频网站| 亚洲毛片无码专区亚洲乱|