System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及目標檢測,更確切地說,它涉及基于解耦detr的目標檢測錯誤修復方法。
技術介紹
1、目標檢測作為計算機視覺中的關鍵任務之一,旨在識別圖像中的對象并確定其位置。在較為傳統的目標檢測方法中,如r-cnn和yolo等,它們基于卷積神經網絡(cnn)來提取圖像特征,再進行單獨的分類和邊界框的回歸步驟。然而,這些方法通常需要復雜的啟發式操作,如額外的階段處理、錨框和非極大值抑制(nms)來過濾冗余檢測,使得模型的優化和解釋變得困難。
2、近年來,detr(detection?transformer)的引入革新了目標檢測領域。detr將最初用于自然語言處理任務的transformer架構應用于目標檢測任務,從而改變了傳統的檢測方式。detr使用一種基于集合的全局損失函數,直接預測邊界框和類別標簽,因而不再需要額外的階段處理、錨框和非極大值抑制。detr?的核心架構由骨干網絡、transformer編碼器、transformer解碼器和預測頭組成。骨干網絡用于提取圖像特征,編碼器通過多頭自注意力機制(mhsa)捕捉全局上下文,解碼器則用于生成目標查詢并通過多頭交叉注意力機制(mhca)將查詢與特定的圖像區域相關聯。
3、盡管detr具有諸多優點,但原始detr模型在處理對象查詢時仍存在一些局限性。在傳統的detr中,由于每個查詢同時負責分類(為對象分配標簽)和回歸(通過邊界框來確定對象的位置和大小),從而導致模型行為難以解釋,尤其在發生分類或邊界框的錯誤時,很難進行調試和分析。
>技術實現思路
1、本專利技術的目的是針對現有技術的不足,提出了基于解耦detr的目標檢測錯誤修復方法。
2、第一方面,提供了基于解耦detr的目標檢測錯誤修復方法,包括:
3、s1、選擇目標檢測基礎網絡,并對所述目標檢測基礎網絡進行訓練;所述目標檢測基礎網絡為detr模型;
4、s2、給定預訓練主干和輸入圖像,通過目標檢測回歸部分,獲取邊界框;
5、s3、根據所述輸入圖像,通過目標檢測分類部分,獲取圖像的類別信息;
6、s4、對目標檢測基礎網絡的輸出進行糾錯。
7、作為優選,s2包括:
8、s201、根據解碼器中與位置查詢有關的多頭自注意力部分生成參考邊界框;
9、s202、根據解碼器多頭互注意力部分中各個頭與參考邊界框的關系,生成邊界框中各個邊的偏移;
10、s203、根據所述參考邊界框和邊界框中各個邊的偏移,計算最終邊界框。
11、作為優選,s3包括:
12、s301、將代表n個類別的類別查詢和編碼器輸出進行拼接;
13、s302、將s301中的拼接結果通過多頭自注意力機制,得到類別查詢嵌入;
14、s303、使用目標檢測回歸部分的輸出和所述類別查詢嵌入進行內積來得到圖像中每個物體的類別。
15、作為優選,s4包括:
16、s401、對目標檢測回歸部分進行糾錯,包括:邊界框面積糾錯和邊界框偏移糾錯;
17、s402、對目標檢測分類部分進行糾錯,包括:困難類別糾錯和相似類別糾錯。
18、作為優選,s401中,所述邊界框面積糾錯,包括:在最終邊界框的面積與物體的實際面積不相符時,通過添加面積損失函數限制參考框的面積;所述邊界框偏移糾錯,包括:在邊界框的偏移與物體的實際位置不相符時,通過添加平均特征損失函數糾正多頭互注意力部分的輸出結果。
19、作為優選,s402中,所述困難類別糾錯,包括:根據訓練難度確定困難類別,并增加所述困難類別對應的類別查詢;所述相似類別糾錯,包括:根據相似度確定相似類別,并增加所述相似類別對應的查詢距離。
20、第二方面,提供了基于解耦detr的目標檢測錯誤修復系統,用于執行第一方面任一所述的方法,包括:
21、選擇模塊,用于選擇目標檢測基礎網絡,并對所述目標檢測基礎網絡進行訓練;所述目標檢測基礎網絡為detr模型;
22、第一獲取模塊,用于給定預訓練主干和輸入圖像,通過目標檢測回歸部分,獲取邊界框;
23、第二獲取模塊,用于根據所述輸入圖像,通過目標檢測分類部分,獲取圖像的類別信息;
24、糾錯模塊,用于對目標檢測基礎網絡的輸出進行糾錯。
25、第三方面,提供了一種計算機存儲介質,所述計算機存儲介質內存儲有計算機程序;所述計算機程序在計算機上運行時,使得計算機執行第一方面任一所述的方法。
26、第四方面,提供了一種電子設備,包括:
27、存儲器,用于保存計算機程序;
28、處理器,用于執行所述計算機程序以實現如第一方面任一所述的方法。
29、本專利技術的有益效果是:
30、1.本專利技術通過將detr模型中的回歸和分類過程解耦,能夠針對性地對定位和識別過程中出現的錯誤進行修正。解耦后的模型允許更細致地調整邊界框的生成和類別的預測,從而顯著提高目標檢測的準確率。
31、2.?傳統detr模型由于將分類和回歸耦合在一起,當出現錯誤時難以定位問題。本專利技術通過分離這兩個過程,使得模型的決策過程更加透明,便于理解和解釋模型的行為,尤其是在調試和分析錯誤時。
32、3.本專利技術通過針對性地修復目標檢測過程中的錯誤,特別是在復雜場景下,能夠更準確地處理遮擋、相似物體的區分等問題。這使得模型在多變和復雜的實際應用場景中具有更好的泛化能力。
本文檔來自技高網...【技術保護點】
1.基于解耦DETR的目標檢測錯誤修復方法,其特征在于,包括:
2.根據權利要求1所述的基于解耦DETR的目標檢測錯誤修復方法,其特征在于,S2包括:
3.根據權利要求2所述的基于解耦DETR的目標檢測錯誤修復方法,其特征在于,S3包括:
4.根據權利要求3所述的基于解耦DETR的目標檢測錯誤修復方法,其特征在于,S4包括:
5.根據權利要求4所述的基于解耦DETR的目標檢測錯誤修復方法,其特征在于,S401中,所述邊界框面積糾錯,包括:在最終邊界框的面積與物體的實際面積不相符時,通過添加面積損失函數限制參考框的面積;所述邊界框偏移糾錯,包括:在邊界框的偏移與物體的實際位置不相符時,通過添加平均特征損失函數糾正多頭互注意力部分的輸出結果。
6.根據權利要求5所述的基于解耦DETR的目標檢測錯誤修復方法,其特征在于,S402中,所述困難類別糾錯,包括:根據訓練難度確定困難類別,并增加所述困難類別對應的類別查詢;所述相似類別糾錯,包括:根據相似度確定相似類別,并增加所述相似類別對應的查詢距離。
7.基于解耦DET
8.一種計算機存儲介質,其特征在于,所述計算機存儲介質內存儲有計算機程序;所述計算機程序在計算機上運行時,使得計算機執行權利要求1至6任一所述的方法。
9.一種電子設備,其特征在于,包括:
...【技術特征摘要】
1.基于解耦detr的目標檢測錯誤修復方法,其特征在于,包括:
2.根據權利要求1所述的基于解耦detr的目標檢測錯誤修復方法,其特征在于,s2包括:
3.根據權利要求2所述的基于解耦detr的目標檢測錯誤修復方法,其特征在于,s3包括:
4.根據權利要求3所述的基于解耦detr的目標檢測錯誤修復方法,其特征在于,s4包括:
5.根據權利要求4所述的基于解耦detr的目標檢測錯誤修復方法,其特征在于,s401中,所述邊界框面積糾錯,包括:在最終邊界框的面積與物體的實際面積不相符時,通過添加面積損失函數限制參考框的面積;所述邊界框偏移糾錯,包括:在邊界框的偏移與物體的實際位置不相符時,通過添加...
【專利技術屬性】
技術研發人員:薛夢琦,劉嘉軒,張皓飛,王燦,宋明黎,
申請(專利權)人:浙大城市學院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。