System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及圖像處理,尤其涉及一種適用于航拍小目標的檢測方法、裝置和設備。
技術介紹
1、隨著城市化進程的加速,對城市土地的調查、建筑物的監測以及生態環境的監測等任務變得越來越重要,傳統的基于人工外業調查的方法不僅成本高昂,而且效率低下。在目標檢測領域,隨著深度學習技術的發展,提出了如faster?r-cnn、yolo系列和ssd等模型,這些模型在一般目標檢測任務中表現良好,但在無人機航拍場景中仍面臨顯著挑戰。無人機航拍圖像具有目標分辨率低、目標占比小、背景復雜等特點,傳統目標檢測算法在應對這些問題時存在局限性。首先,小目標在圖像中僅占極少的像素,現有的多尺度特征融合方法難以保留和提取小目標的關鍵信息。此外,航拍場景中復雜的背景和遮擋問題進一步增加了檢測難度。尤其在實時監控、災害應急等需要高效處理的場景中,模型不僅需要具備高精度,還必須保持較高的計算效率。然而現有的目標檢測算法在處理小目標檢測和復雜背景時的精度與速度之間難以取得平衡。現有的主流目標檢測算法,如yolo系列,雖然在速度上具有優勢,但其對小目標的檢測能力仍有較大的提升空間,復雜場景中的目標識別精度和泛化能力也有待優化。
技術實現思路
1、本專利技術點目的在于:為解決當前的目標檢測算法在處理小目標檢測和復雜背景時的精度與速度之間難以取得平衡的問題,本專利技術提供一種適用于航拍小目標的檢測方法、裝置和設備。
2、本申請實施例的技術方案是這樣實現的:
3、本申請實施例第一方面提供一種適用于航拍小目標
4、獲取待檢測圖像;
5、利用雙向特征金字塔網絡dbifpn在同一特征層的輸入和輸出特征之間添加跳躍連接,融合不同分辨率的輸入特征層,從所述待檢測圖像中提取初始特征信息;所述雙向特征金字塔網絡dbifpn為融合bifpn網絡和多元分支模塊c2fdb形成;
6、利用多元分支模塊c2fdb對所述初始特征信息進行捕捉和強化,得到中間特征信息;所述多元分支模塊c2fdb為融合多分支結構dbb和yolov8的c2f模塊形成;
7、利用邊界框回歸損失函數對所述中間特征信息進行優化,得到目標特征信息,并通過三重注意力機制和動態頭部框架對所述目標特征信息進行表達。
8、可選的,所述利用雙向特征金字塔網絡dbifpn在同一特征層的輸入和輸出特征之間添加跳躍連接,融合不同分辨率的輸入特征層,從所述待檢測圖像中提取初始特征信息,包括:
9、利用網絡學習確定不同輸入特征層對應的權值;
10、基于各個所述輸入特征層對應的權值融合不同分辨率的輸入特征層,得到輸入融合層;
11、將所述待檢測圖像輸入至所述輸入融合層,提取得到初始特征信息。
12、可選的,所述利用雙向特征金字塔網絡dbifpn在同一特征層的輸入和輸出特征之間添加跳躍連接,融合不同分辨率的輸入特征層,從所述待檢測圖像中提取初始特征信息,包括:向上融合和向下融合;所述向上融合的原理為:
13、;
14、是融合后的特征圖,是更高層級的融合特征圖,是當前層級的原始特征圖,和是學習到的加權系數,upsample是上采樣操作,conv是卷積操作;
15、所述向下融合的原理為:
16、;
17、是當前層的向上融合輸出,是上一個更低層的原始特征圖,down是下采樣操作。
18、可選的,在利用多元分支模塊c2fdb對所述初始特征信息進行捕捉和強化,得到中間特征信息之前,還包括:
19、對c2f模塊的bottleneck模塊中的卷積核引入dbb模塊,得到多元分支模塊c2fdb。
20、可選的,所述利用邊界框回歸損失函數對所述中間特征信息進行優化,得到目標特征信息,并通過三重注意力機制和動態頭部框架對所述目標特征信息進行表達,包括:
21、利用動態非單調聚焦機制創建邊界框回歸損失函數;所述邊界框回歸損失函數包括第一損失函數wiou?v1、第二損失函數wiou?v2和第三損失函數wiou?v3;其中,
22、wiou?v1的表達式為:
23、;
24、;
25、wiou?v2的表達式為:
26、;
27、wiou?v3定義離群值來衡量錨框的質量,;
28、wiou?v3的表達式為:
29、;
30、這里,表示加權iou損失,表示iou損失中的距離懲罰項,b表示預測框,gt表示真實框,下標cx和cy分別表示中心點的x和y坐標,表示真實框的中心點的x坐標,表示預測框的中心點的x坐標,同理,表示真實框的中心點的y坐標,表示預測框的中心點的y坐標,cw和ch分別表示能夠包含預測框和真實框的最小閉包區域的寬度和高度,,。
31、可選的,在利用邊界框回歸損失函數對所述中間特征信息進行優化,得到目標特征信息,并通過三重注意力機制和動態頭部框架對所述目標特征信息進行表達之前,還包括:
32、在yolov8的骨干網絡的最后一層添加三重注意力機制。
33、可選的,所述利用邊界框回歸損失函數對所述中間特征信息進行優化,得到目標特征信息,并通過三重注意力機制和動態頭部框架對所述目標特征信息進行表達,包括:
34、通過動態頭部框架和所述目標特征信息動態調整卷積核的屬性,確定待檢測目標的空間位置和形狀。
35、本申請實施例第二方面提供一種適用于航拍小目標的檢測裝置,包括:攝像模塊、雙向特征金字塔網絡dbifpn、多元分支模塊c2fdb和表達模塊;其中,
36、攝像模塊,配置為獲取待檢測圖像;
37、雙向特征金字塔網絡dbifpn,為融合bifpn網絡和多元分支模塊c2fdb形成,配置為在同一特征層的輸入和輸出特征之間添加跳躍連接,融合不同分辨率的輸入特征層,從所述待檢測圖像中提取初始特征信息;
38、多元分支模塊c2fdb,為融合多分支結構dbb和yolov8的c2f模塊形成,配置為對所述初始特征信息進行捕捉和強化,得到中間特征信息;
39、表達模塊,配置為利用邊界框回歸損失函數對所述中間特征信息進行優化,得到目標特征信息,并通過三重注意力機制和動態頭部框架對所述目標特征信息進行表達。
40、本申請實施例第三方面提供一種電子設備,包括處理器和存儲器;所述存儲器有存儲計算機程序,其中,所述計算機程序在被所述處理器執行時實現第一方面所述的適用于航拍小目標的檢測方法。
41、本申請實施例第四方面提供一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現第一方面所述方法的步驟。
42、與現有技術相比,本申請提供的技術方案帶來的有益效果是:
43、本專利技術提供一種適用于航拍小目標的檢測方法、裝置和設備,通過利用雙向特征金字塔網絡dbifpn在同一特征層的輸入和輸出特本文檔來自技高網...
【技術保護點】
1.一種適用于航拍小目標的檢測方法,應用于YOLOv8模型,其特征在于,包括:
2.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,所述利用雙向特征金字塔網絡DBiFPN在同一特征層的輸入和輸出特征之間添加跳躍連接,融合不同分辨率的輸入特征層,從所述待檢測圖像中提取初始特征信息,包括:
3.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,所述利用雙向特征金字塔網絡DBiFPN在同一特征層的輸入和輸出特征之間添加跳躍連接,融合不同分辨率的輸入特征層,從所述待檢測圖像中提取初始特征信息,包括:向上融合和向下融合;所述向上融合的原理為:
4.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,在利用多元分支模塊C2fDB對所述初始特征信息進行捕捉和強化,得到中間特征信息之前,還包括:
5.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,所述利用邊界框回歸損失函數對所述中間特征信息進行優化,得到目標特征信息,并通過三重注意力機制和動態頭部框架對所述目標特征信息進行表達,包括:
6.根據
7.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,所述利用邊界框回歸損失函數對所述中間特征信息進行優化,得到目標特征信息,并通過三重注意力機制和動態頭部框架對所述目標特征信息進行表達,包括:
8.一種適用于航拍小目標的檢測裝置,其特征在于,包括:攝像模塊、雙向特征金字塔網絡DBiFPN、多元分支模塊C2fDB和表達模塊;其中,
9.一種電子設備,包括處理器和存儲器;所述存儲器有存儲計算機程序,其中,所述計算機程序在被所述處理器執行時實現權利要求1至7中任一項所述的適用于航拍小目標的檢測方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現權利要求1至7任一所述方法的步驟。
...【技術特征摘要】
1.一種適用于航拍小目標的檢測方法,應用于yolov8模型,其特征在于,包括:
2.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,所述利用雙向特征金字塔網絡dbifpn在同一特征層的輸入和輸出特征之間添加跳躍連接,融合不同分辨率的輸入特征層,從所述待檢測圖像中提取初始特征信息,包括:
3.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,所述利用雙向特征金字塔網絡dbifpn在同一特征層的輸入和輸出特征之間添加跳躍連接,融合不同分辨率的輸入特征層,從所述待檢測圖像中提取初始特征信息,包括:向上融合和向下融合;所述向上融合的原理為:
4.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,在利用多元分支模塊c2fdb對所述初始特征信息進行捕捉和強化,得到中間特征信息之前,還包括:
5.根據權利要求1所述的適用于航拍小目標的檢測方法,其特征在于,所述利用邊界框回歸損失函數對所述中間特征信息進行優化,得到目標特征信息,并通過三重注意力機制和動態頭部...
【專利技術屬性】
技術研發人員:王茂才,丁麗媛,戴光明,彭雷,宋志明,陳曉宇,
申請(專利權)人:中國地質大學武漢,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。