System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)屬于泥石流評估,具體涉及一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法。
技術(shù)介紹
1、泥石流具有突發(fā)性、流速快、破壞力強(qiáng)等特點,往往多發(fā)于地質(zhì)不良的山地或丘陵地區(qū),是一種由山體滑坡和強(qiáng)降雨引發(fā)的復(fù)雜地質(zhì)災(zāi)害,其發(fā)生過程常常與強(qiáng)降雨、地形地貌、土壤條件及植被覆蓋等因素密切相關(guān)。特別是在臺風(fēng)暴雨期間,大量降水短時間內(nèi)集中釋放,使得山體的水文條件急劇變化,從而顯著增加泥石流的發(fā)生風(fēng)險。因此,對泥石流易發(fā)性的評估至關(guān)重要,以便及時采取防范措施,減少災(zāi)害損失。
2、臺風(fēng)暴雨帶來的短歷時強(qiáng)降雨,是臺風(fēng)暴雨型泥石流形成的關(guān)鍵因素,因此對于降雨數(shù)據(jù)時間范圍的選取對泥石流易發(fā)性地圖的準(zhǔn)確性具有顯著影響。隨著機(jī)器學(xué)習(xí)的發(fā)展,泥石流風(fēng)險評估的精確度得到了顯著提升。catboost作為一種高效的分類和回歸工具,能夠很好地處理類別型特征,但是針對臺風(fēng)暴雨型泥石流的低頻性問題,樣本數(shù)量稀缺容易影響模型訓(xùn)練效果。
技術(shù)實現(xiàn)思路
1、考慮catboost的涉及多個超參數(shù),通過調(diào)整超參數(shù)可以提高模型的性能,本專利技術(shù)通過引入smote算法以解決數(shù)據(jù)集中的不平衡問題,構(gòu)建基于woa、iso、csa、iga優(yōu)化模型的集成優(yōu)化算法,對catboost回歸模型參數(shù)進(jìn)行尋優(yōu),并評估對比四種優(yōu)化模型的優(yōu)化效果。此外,還引入了不同時間尺度降雨數(shù)據(jù)對模型預(yù)測能力的影響,旨在識別最適合臺風(fēng)暴雨型泥石流預(yù)測的降雨數(shù)據(jù)時間范圍,提升臺風(fēng)暴雨型泥石流易發(fā)性圖的預(yù)測準(zhǔn)確性,為災(zāi)害預(yù)防和減災(zāi)工作提供科學(xué)支持。
...【技術(shù)保護(hù)點】
1.一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:針對研究區(qū)域選取影響因子,建立評價指標(biāo)體系,并依據(jù)指標(biāo)需求獲取研究區(qū)域的遙感影像、柵格數(shù)據(jù)、地形地貌信息、水文地質(zhì)資料、兩種不同時間長度的降雨數(shù)據(jù)以及歷史泥石流災(zāi)害記錄;接著運(yùn)用ArcGIS提取因子數(shù)據(jù)并進(jìn)行預(yù)處理,通過因子相關(guān)性分析方法篩選無相關(guān)性的特征因子,應(yīng)用多重共線性分析方法定量的衡量多元因子之間共線性并利用KPCA法消除因子之間相關(guān)性;然后使用SMOTE算法對泥石流發(fā)生樣本進(jìn)行過采樣,以平衡數(shù)據(jù)集中的類別分布;再通過基于WOA、ISO、CSA、IGA優(yōu)化模型的集成優(yōu)化算法,對CatBoost回歸模型參數(shù)進(jìn)行尋優(yōu);并通過Sklearn進(jìn)行k折交叉驗證評估模型穩(wěn)定性,計算準(zhǔn)確度、平均方差、AUC值評估模型性能,識別最佳模型;最后采用最佳模型繪制泥石流易發(fā)性圖,分析不同時間范圍的降雨數(shù)據(jù)對泥石流易發(fā)性預(yù)測準(zhǔn)確率的影響。
2.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述針對研究區(qū)域選取影響因子,建立評價指標(biāo)體系,并依據(jù)指標(biāo)需求獲取研究區(qū)域的遙感影像、柵
3.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述運(yùn)用ArcGIS提取因子數(shù)據(jù)并進(jìn)行預(yù)處理,通過因子相關(guān)性分析方法篩選無相關(guān)性的特征因子,應(yīng)用多重共線性分析方法定量的衡量多元因子之間共線性并利用KPCA法消除因子之間相關(guān)性具體為:運(yùn)用ArcGIS提取因子數(shù)據(jù)并進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗,處理缺失值、異常值以及歸一化處理;通過Spearman秩相關(guān)系數(shù)分析篩選無相關(guān)性的特征因子,應(yīng)用多重共線性分析方法的方差膨脹因子VIF與容許度TOL進(jìn)行因子多元共線性分析并利用核主成分分析KPCA法消除因子之間相關(guān)性。
4.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述使用SMOTE算法對泥石流發(fā)生樣本進(jìn)行過采樣,以平衡數(shù)據(jù)集中的類別分布具體為:使用合成少數(shù)過采樣技術(shù)SMOTE對泥石流發(fā)生樣本進(jìn)行過采樣,通過在少數(shù)類樣本的特征空間中插值生成新的合成樣本,從而增加少數(shù)類樣本的數(shù)量,使得數(shù)據(jù)集中的類別分布更加均衡。
5.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述通過基于WOA、ISO、CSA、IGA優(yōu)化模型的集成優(yōu)化算法,對CatBoost回歸模型參數(shù)進(jìn)行尋優(yōu)具體為:首先構(gòu)建基于鯨魚優(yōu)化算法WOA、改進(jìn)的蛇優(yōu)化算法ISO、布谷鳥搜索算法CSA和改進(jìn)的遺傳算法IGA優(yōu)化模型的集成算法,對Catboost回歸模型的最大決策樹數(shù)目iterations、影響訓(xùn)練的總時長learning_rate、樹的深度depth、正則子參數(shù)12_leaf_reg、數(shù)值特征分割數(shù)border_count、類別特征分割數(shù)ctr_border_count六個超參數(shù)進(jìn)行尋優(yōu),并為每種優(yōu)化模型設(shè)置初始參數(shù),包括種群大小、迭代次數(shù)、收斂條件等,依次分別進(jìn)行迭代搜索最優(yōu)參數(shù)組合。
6.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述通過Sklearn進(jìn)行k折交叉驗證評估模型穩(wěn)定性,計算準(zhǔn)確度、平均方差、AUC值評估模型性能,識別最佳模型的過程中:通過計算準(zhǔn)確度和平均方差評判模型預(yù)測性能;通過繪制ROC曲線,計算ROC曲線下的面積作為AUC值以評估模型的綜合性能。
7.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述采用最佳模型繪制泥石流易發(fā)性圖,分析不同時間范圍的降雨數(shù)據(jù)對泥石流易發(fā)性預(yù)測準(zhǔn)確率的影響具體為:采用最佳模型繪制泥石流易發(fā)性圖,分析不同時間范圍的降雨數(shù)據(jù)對泥石流易發(fā)性預(yù)測準(zhǔn)確率的影響,利用頻率比分析確定臺風(fēng)暴雨型泥石流采用降雨數(shù)據(jù)的最佳時間范圍,以生成泥石流易發(fā)性地圖。
8.一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價系統(tǒng),其特征在于,包括:數(shù)據(jù)采集模塊,用于針對研究區(qū)域選取影響因子,建立評價指標(biāo)體系,并依據(jù)指標(biāo)需求獲取研究區(qū)域的遙感影像、柵格數(shù)據(jù)、地形地貌信息、水文地質(zhì)資料、兩種不同時間長度的降雨數(shù)據(jù)以及歷史泥石流災(zāi)害記錄...
【技術(shù)特征摘要】
1.一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:針對研究區(qū)域選取影響因子,建立評價指標(biāo)體系,并依據(jù)指標(biāo)需求獲取研究區(qū)域的遙感影像、柵格數(shù)據(jù)、地形地貌信息、水文地質(zhì)資料、兩種不同時間長度的降雨數(shù)據(jù)以及歷史泥石流災(zāi)害記錄;接著運(yùn)用arcgis提取因子數(shù)據(jù)并進(jìn)行預(yù)處理,通過因子相關(guān)性分析方法篩選無相關(guān)性的特征因子,應(yīng)用多重共線性分析方法定量的衡量多元因子之間共線性并利用kpca法消除因子之間相關(guān)性;然后使用smote算法對泥石流發(fā)生樣本進(jìn)行過采樣,以平衡數(shù)據(jù)集中的類別分布;再通過基于woa、iso、csa、iga優(yōu)化模型的集成優(yōu)化算法,對catboost回歸模型參數(shù)進(jìn)行尋優(yōu);并通過sklearn進(jìn)行k折交叉驗證評估模型穩(wěn)定性,計算準(zhǔn)確度、平均方差、auc值評估模型性能,識別最佳模型;最后采用最佳模型繪制泥石流易發(fā)性圖,分析不同時間范圍的降雨數(shù)據(jù)對泥石流易發(fā)性預(yù)測準(zhǔn)確率的影響。
2.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述針對研究區(qū)域選取影響因子,建立評價指標(biāo)體系,并依據(jù)指標(biāo)需求獲取研究區(qū)域的遙感影像、柵格數(shù)據(jù)、地形地貌信息、水文地質(zhì)資料、兩種不同時間長度的降雨數(shù)據(jù)以及歷史泥石流災(zāi)害記錄具體為:針對研究區(qū)域多尺度提取泥石流影響因子并將影響泥石流發(fā)生的因素分類整合為地形地貌因子、地質(zhì)構(gòu)造因子、水文因子、人為因子、誘發(fā)因子,建立符合臺風(fēng)暴雨型泥石流特征的評價指標(biāo)體系;依據(jù)因子獲取研究區(qū)域的遙感影像、柵格數(shù)據(jù)、地形地貌信息、水文地質(zhì)資料、兩種不同時間長度的降雨數(shù)據(jù)以及歷史泥石流災(zāi)害記錄。
3.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述運(yùn)用arcgis提取因子數(shù)據(jù)并進(jìn)行預(yù)處理,通過因子相關(guān)性分析方法篩選無相關(guān)性的特征因子,應(yīng)用多重共線性分析方法定量的衡量多元因子之間共線性并利用kpca法消除因子之間相關(guān)性具體為:運(yùn)用arcgis提取因子數(shù)據(jù)并進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗,處理缺失值、異常值以及歸一化處理;通過spearman秩相關(guān)系數(shù)分析篩選無相關(guān)性的特征因子,應(yīng)用多重共線性分析方法的方差膨脹因子vif與容許度tol進(jìn)行因子多元共線性分析并利用核主成分分析kpca法消除因子之間相關(guān)性。
4.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述使用smote算法對泥石流發(fā)生樣本進(jìn)行過采樣,以平衡數(shù)據(jù)集中的類別分布具體為:使用合成少數(shù)過采樣技術(shù)smote對泥石流發(fā)生樣本進(jìn)行過采樣,通過在少數(shù)類樣本的特征空間中插值生成新的合成樣本,從而增加少數(shù)類樣本的數(shù)量,使得數(shù)據(jù)集中的類別分布更加均衡。
5.根據(jù)權(quán)利要求1所述的一種基于集成學(xué)習(xí)算法的臺風(fēng)暴雨型泥石流易發(fā)性評價方法,其特征在于:所述通過基于woa、iso、csa、iga優(yōu)化模型的集成優(yōu)化算法,對catboost回歸模型參數(shù)進(jìn)行尋優(yōu)具體為:首先構(gòu)建基于鯨魚...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:林川,潘依琳,杜哲鎵,林彥喆,賈一帆,蘇燕,賴曉鶴,
申請(專利權(quán))人:福州大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。