System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于gnss反射信號測量森林地上生物量和冠層高,具體地說,涉及一種結合樹模型集成學習算法和shap解釋器的星載gnss-r重要特征選擇及森林地上生物量和冠層高估測方法。
技術介紹
1、森林地上生物量(above-groundbiomass,agb)是一個重要的氣候變量,對于全球碳分布、碳儲存等起著至關重要的作用,能夠幫助減緩氣候變化,同時,agb對于維持森林中的生物多樣性方面也起著關鍵的作用。冠層高(canopy?height,ch)指的是森林中樹冠的最高點到地面的垂直距離,它能反映森林的結構和生長狀態,與agb密切相關。傳統的測量agb的衛星任務有合成孔徑雷達,但是受飽和量的限制;微波輻射測量也發揮著重要作用,但是受空間分辨率較低的影響。全球廣泛的森林覆蓋區域使得利用遙感技術測量agb和ch是一個不錯的選擇,全球導航衛星系統反射測量(global?navigation?satellite?system-reflectometry,gnss-r)的工作波段(l波段)信號具有良好的穿透能力,使得gnss-r信號具有能夠穿透大氣、植被等,有助于感知植被下的土壤的優勢,并且無源的星載gnss-r接收機使得利用該技術反演agb和ch有著極大的成本優勢。植被導致的土壤近鏡面反射信號的衰減是gnss-r數據對生物量敏感的主要機制,因此,表面反射率(reflectivity)是反演agb的關鍵觀測值,可從延遲多普勒圖(delay-dopplermap,ddm)中計算得到。
2、計算機技術的發展推動了機器學習的快速發展,對
3、有鑒于此特提出本專利技術。
技術實現思路
1、為了克服現有基于機器學習的星載gnss-r特征選擇及森林地上生物量和冠層高度估測方法中的不足,針對當前方法存在的特征解釋不充分、特征冗余繁雜、模型可解釋性不強,以及反演效率和精度較低等問題,本專利技術提出了一種結合樹模型集成學習算法和shap解釋器的星載gnss-r重要特征選擇及森林地上生物量和冠層高度估測方法,該方法結合catboost、xgboost和lightgbm三種樹模型算法以及shap解釋器分別對星載gnss-r森林地上生物量和冠層高估測模型中的輸入變量特征參數進行組合優選,利用選取的最優特征參數組合構建基于三種樹模型算法的森林地上生物量和冠層高估測模型,該方法可以很好解釋機器學習中的重要特征,提高模型訓練速度,并且具有良好的反演精度。
2、為解決上述技術問題,本專利技術采用技術方案的基本構思是:
3、一種結合樹模型集成學習算法和shap解釋器的星載gnss-r重要特征選擇及森林地上生物量和冠層高估測方法,包括以下步驟:
4、步驟s1,從相關網站下載和收集8顆cygnss衛星l1級觀測數據以及smap、noaa?1km分辨率的dem數據、歐洲航天局(esa)cci生物量(agb)圖、lucid?agb、基于gedi?lidar數據的gedi冠層高(ch)、集成gedi和landsat數據的冠層高(ch)數據;
5、步驟s2,agb和ch數據集按照5km×5km空間分辨率格網化,并與cygnss衛星l1級觀測數據進行時空匹配,同時對cygnss數據進行質量控制以過濾嚴重影響反射信號的觀測值;
6、步驟s3,從8顆cygnss衛星l1級觀測數據提取變量參數并使用cygnss衛星gnss-r數據計算地表反射率(reflectivity);
7、步驟s4,對數據集進行劃分,占總數據集的60%作為訓練集,占總數據集的40%
8、作為測試集;
9、步驟s5,結合catboost、xgboost和lightgbm算法以及shap解釋器分別對星載gnss-r森林地上生物量和冠層高估測模型中的輸入變量特征參數進行組合優選,利用選取的最優特征參數組合構建基于三種樹模型算法的星載gnss-r森林地上生物量和冠層高估測模型;
10、步驟s6,分別利用歐洲航天局(esa)cci生物量(agb)圖、lucid?agb、基于gedilidar數據的gedi冠層高(ch)、集成gedi和landsat數據的冠層高(ch)數據作為參考,將測試數據集中選取的最優變量特征參數作為輸入,輸入到已經訓練的星載gnss-r森林地上生物量和冠層高估測模型中計算得到gnss-r?agb和ch估計值,最后分別將gnss-r?agb和ch估計值與參考數據進行對比,采用均方根誤差(rmse)、平均絕對誤差(mae)和pearson相關系數(cc)作為評估模型反演性能的指標,以驗證模型估測agb和ch的精度。
11、進一步地,步驟s1所述采用的smap數據具體包括土壤濕度變量(sm)、地表溫度(sst)、地表粗糙度系數(rc),并且空間分辨率和時間分辨率分別為:36km×36km和1天;采用的歐洲航天局(esa)cci生物量(agb)圖空間分辨率和時間分辨率分別為100m和1年;采用的lucid?agb數據空間分辨率和時間分辨率分別為1km和1年;采用的基于gedi?lidar數據的gedi冠層高(ch)空間分辨率和時間分辨率分別為0.5°和1年、集成gedi和landsat數據的冠層高(ch)數據的空間分辨率和時間分辨率分別為30m和1年。
12、進一步地,步驟s2所述的將agb和ch數據集統一到5km?x?5km空間分辨率格網上并與cygnss衛星l1級觀測數據進行時空匹配,同時對cygnss數據進行質量控制,具體方法是采用cygnss?gnsss-r?l1數據集中提供的質量標識(quality_flags)變量進行數據過濾,即將12個質量標識(分別是s?bandpowered?up、large?spacecraft?attitude?error、blackbody?ddm、ddmi?reconfigured、spacewire?crc?invalid、dd本文檔來自技高網...
【技術保護點】
1.一種結合樹模型集成學習算法和SHAP解釋器的星載GNSS-R重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種結合樹模型集成學習算法和SHAP解釋器的星載GNSS-R重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于:步驟S1中采用的SMAP數據具體包括土壤濕度(SM)變量、地表溫度(SST)、地表粗糙度系數(RC)三個輔助數據,并且空間分辨率和時間分辨率分別為:36km×36km和1天;采用的歐洲航天局(ESA)CCI生物量(AGB)圖空間分辨率和時間分辨率分別為100m和1年;采用的LUCID?AGB數據空間分辨率和時間分辨率分別為1km和1年;采用的基于GEDI?LIDAR數據的GEDI冠層高(CH)空間分辨率和時間分辨率分別為0.5°和1年、集成GEDI和Landsat數據的冠層高(CH)數據的空間分辨率和時間分辨率分別為30m和1年。
3.根據權利要求1所述的一種結合樹模型集成學習算法和SHAP解釋器的星載GNSS-R重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于:步驟S2中
4.根據權利要求1所述的一種結合樹模型集成學習算法和SHAP解釋器的星載GNSS-R重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于:步驟S3中,從8顆CYGNSS衛星L1級觀測數據提取的變量參數包括分別提取每個鏡面反射點的地表反射率(reflectivity)、提取鏡面反射點處的SNR(ddm_snr)、距離校正增益(RCG)、航天器姿態滾轉角(sc_roll)、航天器姿態俯仰角(sc_pitch)、用于生成DDM波形的GPS衛星PRN碼(prn_code)、GPS航天器編號(sv_num)、DDM軌跡ID(track_id)、DDM的RCG績效指標(FOM)(prn_fig_of_merit)、鏡面反射點經度(sp_lon)、鏡面反射點緯度(sp_lat)、鏡面反射點高度(sp_alt)、鏡面反射點入射角(sp_inc_angle)、鏡面反射點在軌道坐標系中的高度角(sp_theta_orbit)、鏡面反射點在軌道坐標系中的方位角(sp_az_orbit)、鏡面反射點在衛星本體坐標系中高度角(sp_theta_body)、鏡面反射點在衛星本體坐標系方位角(sp_az_body)、接收器到鏡面反射點天線增益(sp_rx_gain)、DDM本底噪聲(ddm_noise_floor)、接收器到鏡面點的距離(rx_to_sp_range)、發射器到鏡面點的距離(tx_to_sp_range)、鏡面點處的菲涅耳功率反射系數(fresnel_coeff)、歸一化BRCS(ddm_nbrcs)、前沿斜率(ddm_les)、NBRCS散射面積(nbrcs_scatter_area)、LES散射區域(les_scatter_area)、DDM?BRCS不確定性(ddm_brcs_uncert)、DDM采集中間時刻對應的UTC時間(ddm_timestamp_utc)、GPS?SV發射功率(gps_tx_power_db_w)、GPS?SV發射天線增益(gps_ant_gain_db_i)、GPS離軸角(gps_off_boresight_angle_deg)和GPS發射器的等效各向同性輻射功率(gps_eirp)觀測變量,同時也提取了雙基地雷達散射截面(BRCS)、有效散射面積(eff_scatter);
5.根據權利要求1所述的一種結合樹模型集成學習算法和SHAP解釋器的星載GNSS-R重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于:步驟S4中對數據集進行劃分的方式為將時空匹配后的數據集分別按占總數據集的60%作為訓練集,占總數據集的40%作為測試集。
6.根據權利要求1所述的...
【技術特征摘要】
1.一種結合樹模型集成學習算法和shap解釋器的星載gnss-r重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種結合樹模型集成學習算法和shap解釋器的星載gnss-r重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于:步驟s1中采用的smap數據具體包括土壤濕度(sm)變量、地表溫度(sst)、地表粗糙度系數(rc)三個輔助數據,并且空間分辨率和時間分辨率分別為:36km×36km和1天;采用的歐洲航天局(esa)cci生物量(agb)圖空間分辨率和時間分辨率分別為100m和1年;采用的lucid?agb數據空間分辨率和時間分辨率分別為1km和1年;采用的基于gedi?lidar數據的gedi冠層高(ch)空間分辨率和時間分辨率分別為0.5°和1年、集成gedi和landsat數據的冠層高(ch)數據的空間分辨率和時間分辨率分別為30m和1年。
3.根據權利要求1所述的一種結合樹模型集成學習算法和shap解釋器的星載gnss-r重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于:步驟s2中,對cygnss數據進行質量控制的具體方法是采用cygnss?gnsss-r?l1數據集中提供的質量標識(quality_flags)變量進行數據過濾,即將12個質量標識(分別是s?band?powered?up、largespacecraft?attitude?error、blackbody?ddm、ddmi?reconfigured、spacewire?crcinvalid、ddm?is?test?patten、channel?idle、direct?signal?in?ddm、low?confidencegps?eirp?estimate、rfidetected、sp?non?existent?error和blackbody?framing?error)設置為“yes”;此外,入射角小于10°和大于60°的觀測數據需要過濾。
4.根據權利要求1所述的一種結合樹模型集成學習算法和shap解釋器的星載gnss-r重要特征選擇及森林地上生物量和冠層高估測方法,其特征在于:步驟s3中,從8顆cygnss衛星l1級觀測數據提取的變量參數包括分別提取每個鏡面反射點的地表反射率(reflectivity)、提取鏡面反射點處的snr(ddm_snr)、距離校正增益(rcg)、航天器姿態滾轉角(sc_roll)、航...
【專利技術屬性】
技術研發人員:布金偉,汪秋蘭,謝佳溪,李歡,籍超穎,劉馨雨,左小清,
申請(專利權)人:昆明理工大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。