System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于計算機視覺,涉及一種基于transformer算法的遙感圖像實時檢測方法。
技術介紹
1、目標檢測作為計算機視覺領域的一個關鍵任務,對于從圖像中識別和定位特定對象具有重要意義。在遙感圖像領域,目標檢測技術的應用尤為廣泛,它使得從高空或太空獲取的圖像數據能夠被有效地分析和解讀。遙感圖像的目標檢測對于環境監測、城市規劃、農業管理、災害評估等多個領域都至關重要。例如,通過檢測遙感圖像中的建筑物、道路、水體等特征,可以為城市規劃提供決策支持。在農業領域,通過識別作物病害和害蟲,可以及時進行病蟲害防治。此外,遙感圖像的實時檢測能力對于快速響應自然災害和環境變化具有不可估量的價值。
2、盡管目標檢測技術在遙感圖像分析中具有巨大的潛力,但其應用仍面臨一系列挑戰。包括:遙感圖像通常具有高分辨率和復雜的背景,這使得目標檢測算法需要處理大量的數據并區分細微的特征差異。遙感圖像中的目標往往具有尺度多樣性,從小尺度的單個物體到大尺度的地理結構,這對檢測算法的尺度適應性提出了更高要求。由于遙感圖像的采集條件可能變化多端,包括光照、天氣和季節等因素的影響,導致圖像中目標的外觀和對比度存在顯著變化,增加了檢測的難度。現有的基于transformer的目標檢測算法在實時性方面往往難以滿足遙感圖像處理的需求,是本領域技術人員亟需解決的問題。
技術實現思路
1、有鑒于此,本專利技術的目的在于提供一種基于transformer算法的遙感圖像實時檢測方法。
2、為達到上述目的,本專利
3、一種基于transformer算法的遙感圖像實時檢測方法,其包括以下步驟:
4、s1、獲取遙感圖像并對遙感圖像進行數據增強預處理;
5、s2、將數據增強后的輸入骨干特征提取網絡提取關鍵信息,生成特征圖;
6、s3、將提取的特征圖輸入構建的多尺度空間特征融合網絡進行特征融合,得到若干綜合特征圖;
7、s4、通過感知查詢模塊對若干綜合特征圖進行解耦,并選擇若干特征輸入至檢測頭模塊中預測潛在目標的位置和類別;
8、s5、按照前述步驟對模型進行訓練,訓練完成后用于遙感圖像實時檢測。
9、進一步,在步驟s1中,獲取公共遙感圖像數據集,并對數據集進行數據增強預處理,其中數據增強預處理采用mosaic圖像數據增強技術,其隨機選取若干幅圖像進行縮放、裁剪和重組拼接,以對數據集進行擴展、優化。
10、進一步,在步驟s2的骨干提取網絡中,首先通過多尺度特征采樣層采取多尺度特征圖,提取的特征圖至少包括特征圖特征圖特征圖并通過aifi模塊對特征圖進行編碼,其過程為:
11、首先,將特征圖轉換為aifi模塊所需要的形狀:
12、
13、其中,各維度定義如上,分別代表查詢張量、鍵張量以及張量,l表示序列長度,d表示序列維度;表示將特征圖第二維和第三維合并,然后在對第一維度和第二維度交換位置;
14、再將轉換后的特征圖輸入至aifi模塊,如圖4所示的aifi模塊的處理過程示意圖,對進行編碼,aifi為經典的transformer?encoder操作,表示為:
15、
16、其中:aifi(*)操作表示為:
17、ln(dropout(ffn(ln(v+dropout(mhead(q,k,v))))+(lv(v+dropout(mhead(q,k,v))))))
18、ln(*)為對通道數上的元素進行歸一化;dropout(*)表示一種正則化技術;ffn(*)表示前饋神經網絡,其定義為:ffn(x)=max(0,w1·x+b1)·w2+b2,w1、w2為權重參數,b1、b2為偏置參數,max(*)為最大值函數;mhead(*)為多個注意力機制的拼接,每個注意力機制定義為:
19、
20、其中,dk為特征維度,(*)t表示矩陣轉置;softmax(*)表示一種多分類激活函數;
21、最后對進行數據形狀變換reshape操作,將特征圖調整為四維張量得到特征圖
22、進一步,在步驟s2中,多尺度特征采樣層包括多個卷積模塊和至少一個激活函數,其中,卷積模塊對輸入特征圖的各個通道執行逐像素的分析處理,并提取對應特征,每個卷積模塊單元內部由基礎卷積操作、歸一化處理和激活函數三個部分組成,其表示為:
23、xout=relu(bn(conv(xinput)))
24、其中,xinput為輸入的四維張量,xinput∈rb×c×h×w,b代表批次大小,c代表通道數量、h×w代表特征圖的尺度,xout代表輸出特征圖,xout∈rb×c×h×w,conv(*)為基礎卷積操作,bn(*)為歸一化操作,relu(*)為激活函數,其定義如下:
25、
26、其中x為輸入張量,當輸入張量經過relu(*)函數時,張量中小于0的元素調整至0,其余元素保持不變。
27、進一步,在步驟s3中,采用多尺度空間特征融合sfmm模塊對特征圖以及重新編碼的特征圖進行特征融合得到綜合特征圖,其包括:
28、s31、對兩個特征圖交叉融合,得到與形狀相同的第一輸出特征圖和與形狀相同的第二輸出特征圖;
29、s32、對第一輸出特征圖、第二輸出特征圖以及特征圖交叉融合,得到分別與特征圖特征圖特征圖形狀相同的第三輸出特征圖、第四輸出特征圖以及第五輸出特征圖。
30、進一步,在步驟s31中,具體包括以下步驟:
31、s311、對特征圖進行下采樣操作,得到與特征圖形狀相同的特征圖;
32、s312、對特征圖進行上采樣操作,得到與特征圖形狀相同的特征圖;
33、s313、將與特征圖形狀相同的特征圖和特征圖進行特征融合得到第一輸出特征圖;將與特征圖形狀相同的特征圖和特征圖進行特征融合得到第二輸出特征圖。
34、進一步,在步驟s32中,具體包括以下步驟:
35、s321、對第一輸出特征圖分別進行上采樣和下采樣,得到分別與第二輸出特征圖和特征圖形狀相同的特征圖;
36、s322、對第二輸出特征圖進行上采樣,得到分別與第一輸出特征圖和特征圖形狀相同的特征圖;
37、s323、對特征圖進行下采樣,得到分別與第一輸出特征圖和第一輸出特征圖相同的特征圖;
38、s323、將第一輸出特征圖下采樣、第二輸出特征上采樣得到的與特征圖形狀相同的特征圖與特征圖進行特征融合得到第三輸出特征圖;
39、將第一輸出特征圖和第二特征圖上采樣、特征圖下采樣得到的與特征圖形狀相同的特征圖進行特征融合,得到第四特征圖;
40、將第一輸出特征圖上采樣、特征圖下采樣得到的與第二輸出特征圖形狀相同的特征圖和第二輸出特征圖進行特征融合,得到第五輸出特征圖;第三輸出特征圖、第四輸出特征圖以及第五輸出特征圖即本文檔來自技高網...
【技術保護點】
1.一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:其包括以下步驟:
2.根據權利要求1所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟S1中,獲取公共遙感圖像數據集,并對數據集進行數據增強預處理,其中數據增強預處理采用Mosaic圖像數據增強技術,其隨機選取若干幅圖像進行縮放、裁剪和重組拼接,以對數據集進行擴展、優化。
3.根據權利要求1所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟S2的骨干提取網絡中,首先通過多尺度特征采樣層采取多尺度特征圖,提取的特征圖至少包括特征圖特征圖特征圖并通過AIFI模塊對特征圖進行編碼,其過程為:
4.根據權利要求3所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟S2中,多尺度特征采樣層包括多個卷積模塊和至少一個激活函數,其中,卷積模塊對輸入特征圖的各個通道執行逐像素的分析處理,并提取對應特征,每個卷積模塊單元內部由基礎卷積操作、歸一化處理和激活函數三個部分組成,其表示為:
6.根據權利要求5所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟S31中,具體包括以下步驟:
7.根據權利要求5所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟S32中,具體包括以下步驟:
8.根據權利要求5所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟S4中,具體包括:
...【技術特征摘要】
1.一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:其包括以下步驟:
2.根據權利要求1所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟s1中,獲取公共遙感圖像數據集,并對數據集進行數據增強預處理,其中數據增強預處理采用mosaic圖像數據增強技術,其隨機選取若干幅圖像進行縮放、裁剪和重組拼接,以對數據集進行擴展、優化。
3.根據權利要求1所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟s2的骨干提取網絡中,首先通過多尺度特征采樣層采取多尺度特征圖,提取的特征圖至少包括特征圖特征圖特征圖并通過aifi模塊對特征圖進行編碼,其過程為:
4.根據權利要求3所述的一種基于transformer算法的遙感圖像實時檢測方法,其特征在于:在步驟s2中,多尺度特征采樣層包括多個卷積模塊和...
【專利技術屬性】
技術研發人員:袁正午,曾凡昶,李金鑫,柯瑛琦,
申請(專利權)人:重慶郵電大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。