System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于城市遙感監測,具體涉及一種基于互信息約束的多任務學習建筑物提取方法及系統。
技術介紹
1、作為城市化進程的核心體現,從高分辨率遙感影像中快速、準確提取建筑物的位置和形狀信息,已成為城市規劃、資源管理以及數字城市建模等領域的基礎需求。然而,由于建筑物形態的復雜多樣性、密集分布排列以及周邊環境的異質性,從高分辨率遙感影像中獲取清晰完整的建筑物面臨著嚴峻挑戰。
2、基于手工設計特征或淺層模型的建筑物提取方法,難以充分挖掘影像中豐富的上下文信息和多尺度特征,因此在復雜場景下表現有限。近年來,基于深度學習的技術在計算機視覺領域取得了巨大成功。特別是卷積神經網絡(cnn)的方法和自注意力機制的visiontransformer(vit)方法,分別在局部細節特征提取和全局語義特征提取能力上表現出色,其強大的特征學習能力使其在遙感影像信息提取任務中也展現出了優異的性能。然而,建筑物提取任務不僅需要捕獲大尺度的全局語義信息以確定建筑物的整體形狀和位置,同時還要學習細粒度的局部細節特征以精確檢測建筑物邊界。單一的卷積神經網絡或視覺轉換器網絡難以滿足建筑物提取任務對多特征尺度的差異化需求。
3、為此,許多研究嘗試引入邊界規則化或約束網絡(例如導向濾波、條件隨機場等),或通過附加的輕量級卷積神經網絡提取邊緣特征,以更好地捕獲建筑物的輪廓和結構。這些后處理操作和額外的優化網絡通常需要復雜的設計和計算,導致計算成本和模型復雜度增加。在這一背景下,多任務學習作為一種潛在的研究方向引起了廣泛關注。多任務學習通過共享特征,在
4、深度學習方法在光譜和時間特征提取方面表現出色,但由于缺乏對多任務學習特征提取網絡的優化設計和任務之間有效的知識傳遞機制,現有多任務學習框架在遙感建筑物提取中的應用仍存在不足,主要缺點如下:
5、1)在權值共享特征提取網絡的設計方面,僅基于卷積神經網絡(cnn)或視覺注意力轉換(vit)的權值共享特征提取網絡無法完全滿足不同任務對于特征尺度的差異需求。一些研究嘗試采用cnn-vit聯合的結構,將它們串聯或并聯,以充分利用它們的優勢。然而,由于全局語義信息與局部空間信息的交互不足與沖突,導致建筑物提取任務在邊界細節的精確性和整體形狀的規則性上存在不足。
6、2)任務間知識傳遞的不足進一步限制了建筑物提取的效率和準確性。雖然不同任務在一定程度上共享了特征表示,但往往只是簡單疊加或級聯,缺乏有效的機制來顯式建模和最大化不同任務之間信息的互相流動,這可能會阻礙各任務間知識的充分傳遞。這種知識傳遞的缺乏不僅減少了模型從相關任務中學習和改進的機會,也限制了模型在處理復雜場景時的適應性和泛化能力。
技術實現思路
1、本專利技術的目的在于克服傳統技術中建筑物分割方法中不完全分割和不規則邊界的問題,提供一種基于互信息約束的多任務學習建筑物提取方法。
2、為實現上述技術目的,達到上述技術效果,本專利技術是通過以下技術方案實現:
3、本專利技術提供一種基于互信息約束的多任務學習建筑物提取方法,包括如下步驟:
4、s1、獲取高分辨率遙感影像,得到樣本信息;
5、s2、通過樣本信息搭建基于互信息約束的多任務學習網絡結構;
6、s3、通過函數提取建筑物空間和光譜特征,進而將遙感影像中的建筑物進行提取。
7、進一步地,步驟s1中,樣本信息的獲取包括遙感數據預處理、分析建筑物遙感影像解譯標志并構建樣本庫。
8、進一步地,步驟s2中,搭建網絡結構的分步驟包括:
9、1)該網絡在共享權重特征提取階段采用上下文信息并行感知結構,通過局部上下文編碼器(lce)和全局上下文編碼器(gce)分四個階段獲取不同尺度的上下文特征;
10、2)在解碼階段使用與編碼器對應的四階段金字塔上采樣解碼器,聚合每個階段的全局和局部上下文特征;
11、3)使用傅里葉互信息平衡模塊來增強模型內的多尺度上下文信息交換;
12、4)使用互信息損失函數來改善兩個任務之間的信息交互。
13、進一步地,步驟1)中,所述局部上下文編碼器(lce)首先使用步幅為2的7×7卷積提取初始圖像特征,然后使用步幅為2的3×3最大池化層;通過四個殘差塊進一步細化這些特征,這些殘差塊對細節特征進行更深入的學習;每個殘差塊由連續的3×3卷積、批量歸一化和relu激活函數組成;這些殘差塊內采用跳躍連接來保持信息流并緩解梯度消失問題。
14、進一步地,步驟1)中,所述全局上下文編碼器(gce)包括pe(patch?embedding)模塊、pm(patch?merging)模塊和vit(vision?transformer)模塊;在pe階段,兩個3×3卷積層將輸入圖像分割成重疊的塊,同時將通道尺寸擴展至96,并將分辨率降低至原始圖像的四分之一;vit模塊由基于窗口的線性多頭自注意力(wlmhsa)模塊、c-mlp、兩個批量歸一化層和兩個殘差連接組成,專注于全局上下文提取;在pm階段,使用2×2卷積層將分辨率進一步降低一半,同時將通道數量增加一倍;這種設計使所述全局上下文編碼器能夠跨多個級別提取豐富的全局特征,從而全面理解復雜的視覺任務。
15、進一步地,步驟2)中,所述金字塔上采樣解碼器對應于編碼器的四個階段,采用漸進式上采樣策略,有效融合來自編碼器網絡的多尺度特征圖并生成共享語義特征;所述金字塔上采樣解碼器首先使用1×1卷積將特征通道統一為384個,然后逐步對特征進行上采樣并與上一級特征進行元素相加,確保深層語義信息有效傳播到淺層特征;最后,對所有尺度的特征進行上采樣和融合,得到一個富含多級語義信息的特征圖。
16、進一步地,步驟3)中,所述傅里葉互信息平衡模塊作為信息橋梁,來融合全局上下文與局部上下文信息,其構建步驟包括:
17、傅里葉互信息平衡模塊首先將全局和局部上下文特征f(x,y)={flocal(x,y),fglobal(x,y)}通過傅里葉變換轉換到頻率域其中(x,y)和(u,v)分別代表空間域和頻率域中的行和列索引:
18、
19、頻率域的局部上下文信息與自適應高通濾波器h(u,v;θ)進行點乘,過濾冗余的低頻成分,同時保留對于細節識別至關重要的高頻信息,得到濾波后的頻率域信息然后通過逆傅里葉變換,將處理后的頻率域信號轉換回空間域,得到經過高頻增強的局部上下文特征flocal(x,y):
20、
21、同樣的,頻率域的全局上下文信息與自適應低通濾波器l(u,v;θ)進行點乘,代表整體語義的低頻信息將會被保留,而高頻噪聲將會被過濾,得到濾波本文檔來自技高網...
【技術保護點】
1.一種基于互信息約束的多任務學習建筑物提取方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟S1中,樣本信息的獲取包括遙感數據預處理、分析建筑物遙感影像解譯標志并構建樣本庫。
3.根據權利要求1所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟S2中,搭建網絡結構的分步驟包括:
4.根據權利要求3所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟1)中,所述局部上下文編碼器首先使用步幅為2的7×7卷積提取初始圖像特征,然后使用步幅為2的3×3最大池化層;通過四個殘差塊進一步細化這些特征,這些殘差塊對細節特征進行更深入的學習;每個殘差塊由連續的3×3卷積、批量歸一化和ReLU激活函數組成;這些殘差塊內采用跳躍連接來保持信息流并緩解梯度消失問題。
5.根據權利要求3所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟1)中,所述全局上下文編碼器(GCE)包括PE模塊、PM模塊和ViT模塊;在PE階段,兩個3×3卷積層將輸入圖像分割
6.根據權利要求3所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟2)中,所述金字塔上采樣解碼器對應于編碼器的四個階段,采用漸進式上采樣策略,有效融合來自編碼器網絡的多尺度特征圖并生成共享語義特征;所述金字塔上采樣解碼器首先使用1×1卷積將特征通道統一為384個,然后逐步對特征進行上采樣并與上一級特征進行元素相加,確保深層語義信息有效傳播到淺層特征;最后,對所有尺度的特征進行上采樣和融合,得到一個富含多級語義信息的特征圖。
7.根據權利要求3所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟3)中,所述傅里葉互信息平衡模塊作為信息橋梁,來融合全局上下文與局部上下文信息,其構建步驟包括:
8.根據權利要求3所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,利用互信息約束損失來顯式地建模和優化不同任務之間的相關性,從而更緊密地對齊任務:
9.一種基于互信息約束的多任務學習建筑物提取系統,其特征在于,包括:
...【技術特征摘要】
1.一種基于互信息約束的多任務學習建筑物提取方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟s1中,樣本信息的獲取包括遙感數據預處理、分析建筑物遙感影像解譯標志并構建樣本庫。
3.根據權利要求1所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟s2中,搭建網絡結構的分步驟包括:
4.根據權利要求3所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟1)中,所述局部上下文編碼器首先使用步幅為2的7×7卷積提取初始圖像特征,然后使用步幅為2的3×3最大池化層;通過四個殘差塊進一步細化這些特征,這些殘差塊對細節特征進行更深入的學習;每個殘差塊由連續的3×3卷積、批量歸一化和relu激活函數組成;這些殘差塊內采用跳躍連接來保持信息流并緩解梯度消失問題。
5.根據權利要求3所述的基于互信息約束的多任務學習建筑物提取方法,其特征在于,步驟1)中,所述全局上下文編碼器(gce)包括pe模塊、pm模塊和vit模塊;在pe階段,兩個3×3卷積層將輸入圖像分割成重疊的塊,同時將通道尺寸擴展至96,并將分辨率降低至原始圖像的四分之一;vit模塊由基于窗口的線性多頭自注意力模塊、c-mlp、兩...
【專利技術屬性】
技術研發人員:楊輝,王彪,吳艷蘭,孫云飛,侯恩兵,任光耀,
申請(專利權)人:安徽大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。