System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請實施例涉及遙感影像語義分割,尤其涉及一種動態蛛網和損失函數協作的深度分層多語義數據處理方法。
技術介紹
1、語義分割旨在為像素賦予語義標簽,在遙感影像解譯中至關重要。大多數分割深度神經網絡在設計時假設目標類別無交互和協同,導致分割誤差累積,無法捕捉視覺世界結構本質。
2、現有語義分割研究在整合語義層次結構方面存在局限,如針對自然場景的方法不適用于遙感影像,或框架修改復雜,且多數未充分考慮標簽依賴性和交互性。在遙感領域,捕捉和表示結構化信息對適應新環境和多層次抽象理解至關重要。
3、感影像具有復雜的數據屬性,如異質性、類不平衡、重疊的類條件分布等,且成像條件會導致攝影失真、尺度變化和光照變化,降低類別可分離性。傳統分層語義分割方法在遙感影像中面臨挑戰,類間從屬關系不可逆,僅依賴單一語義層次劃分易導致分割不準確。
技術實現思路
1、為了克服上述技術缺陷,本申請實施例中提供一種動態蛛網和損失函數協作的深度分層多語義數據處理方法。其具體方案如下:
2、該深度分層多語義數據處理方法適用于基于采用編解碼器結構的resunet網絡構建的分層語義分割網絡hag?net模型中,其編碼器部分包括多尺度殘差塊和邊緣增強模塊,其橋梁部分采用普通卷積網絡和空洞空間金字塔池化aspp模塊,其解碼器部分由多尺度殘差塊和注意力門構成;
3、該深度分層多語義數據處理方法包括:
4、在編碼器部分,通過多尺度殘差塊捕捉不同尺度的特征信息,并采用蛛網結構表
5、在橋梁部分,通過aspp模塊中不同大小的空洞卷積核,捕捉不同尺度的全局上下文信息,提升模型的全局特征能力;
6、在解碼器部分,采用多尺度殘差塊對特征圖進行逐層恢復空間分辨率提取特征信息,并通過注意力門與來自編碼器的邊緣特征拼接;
7、使用定義動態調整后的優化損失函數協同調節蛛網損失,優化損失函數是基于基礎損失函數、預先計算的關聯權重構建,關聯權重矩陣體現語義類別間層次依賴關系,用于平衡不同語義類別在分割過程中的權重。
8、可選的,在一種可能的實現方式中,矩陣記為mcf,關聯權重記為wcf,通過矩陣mcf來形式化關聯權重wcf;
9、其中矩陣的每個元素wcf表示粗分類別c與細分類別f之間的關聯權重;
10、關聯權重wcf的計算基于像素匹配統計:wcf=mcf[c,f],其中,mcf[c,f]表示類別c與類別f之間的像素點匹配數,通過遍歷所有圖像及其對應的標簽來累加得到。
11、可選的,在一種可能的實現方式中,優化損失函數記為lcobweb,基礎損失函數記為lbase,動態因子記為δ,優化損失函數表示為:lcobweb=lbase+δ×(1-r),其中關系比值r為量化語義類別間的依賴程度的量化值;
12、在圖像語義分割任務中,最優分割結果h*(i)表示為圖像i中每個像素i的最優標簽集合其中是通過優化損失函數lcobweb得到的使損失函數最小化的最優標簽;
13、圖像語義分割任務的優化過程表示為:
14、
15、可選的,在一種可能的實現方式中,當從細分類別f到粗分類別c的預測時,類別c對于類別f的關系比值rcf的計算方式如下:wcf=mcf[c,f],式中,mc,f是從細分類別f到粗分類別c的映射矩陣中的元素,表示類別f到類別c的映射強度,分母是對給定的粗分類別c,其中f代表細分類別的總數,確保關系比值是歸一化的;
16、此時,基礎損失函數和調整后的細類別損失函數分別為:
17、和式中,n是圖像中像素的總數,是模型預測第n個像素屬于其真實類別yn的概率,yn是該像素的真實類別索引,屬于細分類別集合,∈是一個非常小的常數,用來保證數值穩定性。
18、可選的,在一種可能的實現方式中,當從粗分類別c到細分類別f的預測時,類別f對于類別c的關系比值rfc的計算方式如下:
19、wcf=mcf[c,f];式中,mc,f是從細分類別f到粗分類別c的映射矩陣中的元素,表示細分類別f到粗分類別c的映射強度,分母是對于給定的細分類別f,其中c代表粗分類別的總數;
20、此時,基礎損失函數和調整后的細類別損失函數分別為:
21、和,式中,n是圖像中像素的總數,是模型預測第n個像素屬于其真實類別yn的概率,yn是該像素的真實類別索引,屬于粗分類別集合,∈是一個非常小的常數,用來保證數值穩定性。
22、可選的,在一種可能的實現方式中,粗分類別為6個,細分類別為16個。
23、可選的,在一種可能的實現方式中,在在編碼器部分,多尺度殘差塊包括三個并行卷積路徑,3x3、5x5和7x7卷積,通過多分辨率路徑捕獲不同尺度特征信息,增強整體性能。
24、可選的,在一種可能的實現方式中,邊緣增強模塊的數量為4個;邊緣增強模塊是通過在普通殘差塊和邊緣提取卷積塊后嵌入輕量級的注意力eca模塊得到;
25、在解碼部分,采用多尺度殘差塊對特征圖進行逐層恢復空間分辨率總共經過五次解碼步驟;
26、在每一層解碼過程中,當前的特征圖與對應的skip?connection特征圖進行拼接,并通過注意力門控attention?gate進行增強,以突出重要的特征區域;
27、解碼器的每一層還會將當前層的特征圖與來自編碼器的邊緣特征和多尺度殘差塊multires?block的特征信息進行拼接,從而進一步融合多尺度的特征信息。
28、本申請實施例中采用上述技術方案可以實現以下技術效果:
29、邊界增強模塊旨在強化特征提取的邊緣信息,從而提升模型對目標邊界的識別能力;
30、多尺度殘差塊通過不同尺度的卷積操作,捕獲圖像中的多層次特征,增強了特征的表達能力。
31、aspp模塊通過不同大小的空洞卷積核,能夠捕獲不同尺度的全局上下文信息,進一步提升了模型的全局特征提取能力。
32、解碼器統一采用multires?block進行逐層恢復空間分辨率,總共經過五次解碼步驟。在每一層解碼過程中,當前的特征圖與對應的skip?connection特征圖進行拼接,并通過attention?gate(ag)進行增強,以突出重要的特征區域。解碼器的每一層還會將當前層的特征圖與來自編碼器的邊緣特征和multires?block的特征信息進行拼接,從而進一步融合多尺度的特征信息。這種結構設計確保了在復雜多變的輸入數據情況下,解碼器能夠有效地恢復圖像的空間分辨率和細節信息,提高分割結果的精度和魯棒性。
33、通過采用非樹形結構(如蛛網結構)來表示類別之間的關系,并利用類別轉移矩陣來形式化這種關系,其中矩陣元素表示粗分類別c與細分類別f之間的關聯權重本文檔來自技高網...
【技術保護點】
1.一種動態蛛網和損失函數協作的深度分層多語義數據處理方法,其特征在于,
2.根據權利要求1所述的深度分層多語義數據處理方法,其特征在于,
3.根據權利要求2所述的深度分層多語義數據處理方法,其特征在于,
4.根據權利要求3所述的深度分層多語義數據處理方法,其特征在于,
5.根據權利要求3所述的深度分層多語義數據處理方法,其特征在于,
6.根據權利要求2、4和5所述的深度分層多語義數據處理方法,其特征在于,粗分類別為6個,細分類別為16個。
7.根據權利要求1所述的深度分層多語義數據處理方法,其特征在于,
8.根據權利要求1所述的深度分層多語義數據處理方法,其特征在于,
【技術特征摘要】
1.一種動態蛛網和損失函數協作的深度分層多語義數據處理方法,其特征在于,
2.根據權利要求1所述的深度分層多語義數據處理方法,其特征在于,
3.根據權利要求2所述的深度分層多語義數據處理方法,其特征在于,
4.根據權利要求3所述的深度分層多語義數據處理方法,其特征在于,
5.根據權...
【專利技術屬性】
技術研發人員:王雷光,楊瑞琦,付浩宇,代沁伶,楊佩柔,陳南,陶世琳,趙毅力,徐偉恒,
申請(專利權)人:西南林業大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。