System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及目標檢測,尤其涉及一種基于深度學習網絡的細粒度目標檢測方法,本專利技術對圖像數據進行細粒度識別,在通用的目標檢測模型基礎上,增加了細粒度分類模型,降低了細粒度目標檢測模型訓練的難度,同時提高了細粒度分類的準確率。
技術介紹
1、細粒度圖像分類是一項具有挑戰性的計算機視覺任務,因為類內差異大,而類間差異小。由于光線、物體姿勢、視角、遮擋、背景干擾等問題,不同個體很難被肉眼區分為同一個子類別。此外,有限的數據集和標注難度也增加了該任務的復雜性。目前的細粒度分類模型基于resnet存在識別困難的問題,無法很好地完成細粒度分類任務。
技術實現思路
1、本專利技術目的就是為了彌補已有技術的缺陷,提供一種基于深度學習網絡的細粒度目標檢測方法(尤其是鳥類識別)。本專利技術通過結合特征提取網絡和特征融合網絡對不同鳥類的特征進行有效把握。相比于傳統方法,該系統在細粒度圖像分類任務中具有更高的識別準確率,能夠有效識別不同種類的鳥類,包括那些僅有微小區別的子類別(如鳥的翅膀顏色和喙顏色)。
2、本專利技術是通過以下技術方案實現的:
3、一種基于深度學習網絡的細粒度目標檢測方法,具體包括以下步驟:
4、(1)采集圖像數據作為輸入;
5、(2)將采集的圖像數據集進行預處理;
6、(3)將預處理后的圖像數據輸入目標檢測模型(如yolov7、fasterrcnn等),根據系統所要求的分類任務(比如鳥類的細化分類)輸出檢測框信息(檢測框的位
7、(4)將裁剪后的圖像輸入細粒度分類模型進行特征提取和特征融合,最終得到細化分類結果。
8、(5)結合目標檢測模型的輸出結果(檢測框位置、大小、可信度信息)和細粒度分類模型的輸出結果(分類結果及其可信度信息),將結果通過圖像處理工具(如opencv)繪制在原圖像上作為最終結果輸出。
9、步驟(1)所述的采集鳥類圖像數據,可以是圖片,視頻或是攝像頭采集的實時數據。
10、步驟(2)所述的將采集的圖像數據進行預處理,即對圖像數據進行縮放、裁剪、水平翻轉、高斯模糊、歸一化操作。
11、步驟(3)(4)具體內容如下:首先,使用目標檢測模型,(如yolov7、fasterrcnn等)根據系統需要完成的分類任務進行(比如鳥類細化分類)目標檢測,根據模型輸出的檢測框信息進行圖像裁剪,進行第二步的細粒度分類檢測;如果沒有檢測到鳥類,則直接輸出原始圖像;
12、在第二步的細粒度分類任務中,采用基于深度學習網絡的細粒度分類模型,其具體結構包括特征提取網絡、特征金字塔網絡、卷積圖神經網絡,最終,將分類結果傳送到輸出端將檢測框信息在原始圖像上繪制出來。
13、所述的特征提取網絡可以使用計算機視覺任務中常用的骨干網絡。在具體實踐中采用4層swin?transformer作為細粒度分類模型的特征提取網絡,并且采用預熱學習策略,預熱學習批次設置為1500。
14、所述的采用的特征金字塔網絡,大小設置為1536;特征金字塔網絡中,使用8個卷積層,用于生成多尺度的特征圖。
15、采用的選擇器模塊(selector)負責篩選特征。具體算法為從所有可能的鳥類中選擇得分最高的n個類別,使用四個不同的selector模塊,每個selector模塊的輸出數量由參數n決定;四個不同的selector模塊分別對應著不同的特征尺度,通過選擇得分最高的類別,聚焦于最相關的鳥類類別。
16、采用9個分類器(classifier)來執行具體的分類任務,每個分類器都對輸入的圖像特征圖進行預測并得出分類結果向量。最終的預測結果通過將9個分類器的輸出進行softmax運算并求和得出。
17、本專利技術的優點是:本專利技術顯著提升了細粒度目標檢測的識別準確率,通過引入新的檢測策略和模型架構,改善了了傳統系統中存在的識別困難問題,使得在細粒度目標檢測任務中取得了更加顯著的進展。
本文檔來自技高網...【技術保護點】
1.一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:具體包括以下步驟:
2.根據權利要求1所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:步驟(1)所述的采集圖像數據,是圖片、視頻或者是攝像頭的實時畫面。
3.根據權利要求1所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:步驟(2)所述的將采集的圖像數據集進行預處理,即對圖像數據集進行縮放、裁剪、水平翻轉、高斯模糊、歸一化操作。
4.根據權利要求1所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:步驟(3)(4)具體內容如下:首先,使用目標檢測模型進行大類目標檢測,對于檢測到的大類,將其結果框選裁剪出來,進行第二步子類分類;如果沒有檢測到大類,則輸出原始圖像結束;
5.根據權利要求4所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:所述的特征提取網絡使用計算機視覺任務中常用的骨干網絡,采用4層Swin?Transformer作為細粒度分類模型的特征提取網絡,并且采用預熱學習策略,預熱學習批次設置為1500。
6.根據權利要
7.根據權利要求4所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:步驟(4)中采用選擇器模塊負責篩選特征,具體算法為:選擇得分最高的n個類別,使用四個不同的選擇器模塊,每個選擇器模塊的輸出數量由參數n決定;四個不同的選擇器模塊分別對應著不同的特征尺度,通過選擇得分最高的類別,聚焦于最相關的類別。
8.根據權利要求7所述的基于深度學習網絡的細粒度目標檢測方法,其特征在于:采用9個分類器來執行具體的分類任務,每個分類器都對輸入的圖像特征圖進行預測并得出分類結果向量,最終的預測結果通過將9個分類器的輸出進行Softmax運算并求和得出。
...【技術特征摘要】
1.一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:具體包括以下步驟:
2.根據權利要求1所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:步驟(1)所述的采集圖像數據,是圖片、視頻或者是攝像頭的實時畫面。
3.根據權利要求1所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:步驟(2)所述的將采集的圖像數據集進行預處理,即對圖像數據集進行縮放、裁剪、水平翻轉、高斯模糊、歸一化操作。
4.根據權利要求1所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:步驟(3)(4)具體內容如下:首先,使用目標檢測模型進行大類目標檢測,對于檢測到的大類,將其結果框選裁剪出來,進行第二步子類分類;如果沒有檢測到大類,則輸出原始圖像結束;
5.根據權利要求4所述的一種基于深度學習網絡的細粒度目標檢測方法,其特征在于:所述的特征提取網絡使用計算機視覺任務中常用的骨干網絡,采用4層swin?trans...
【專利技術屬性】
技術研發人員:朱金良,商文濤,胡文波,
申請(專利權)人:合肥瑞徽人工智能研究院有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。