System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及環境污染預測領域,尤其涉及基于機器學習的土壤重金屬污染風險分區分級方法。
技術介紹
1、城市工業化進程極大地增加土壤重金屬濃度的輸入,導致區域土壤重金屬污染嚴重。識別和科學劃分潛在污染風險區域在我國土壤污染復雜的特征背景下,具有重要的研究意義。基于污染場地特點,結合區域規劃需求,開展區域土壤重金屬污染場地風險評估,劃分地塊風險等級與區域,實現對各個污染地塊的分類管控、分區治理。
2、定量分析法雖然綜合考慮各項指標和要素,但較少考慮相鄰單元間的空間聯系和相互作用,分區成果不符合實際需求。定性分區方法精確度不高,計算量小,適用于較難定量化的區域,主要依賴研究者主觀判斷,不能支撐整個綜合分區過程,只能用于初步分區。對于區域土壤重金屬污染風險識別和潛在污染風險區域識別,目前還缺乏系統的分析方法。
技術實現思路
1、本專利技術的主要目的是提供一種基于機器學習的土壤重金屬污染風險分區分級方法,以解決區域土壤重金屬污染風險識別和潛在污染風險區域識別缺乏系統的分析方法的技術問題。
2、為實現上述目的,本專利技術提供了一種基于機器學習的土壤重金屬污染風險分區分級方法,包括以下步驟:
3、分別獲取研究區域內的重金屬樣本數據和環境協變數據,作為目標重金屬的對應初始樣本數據集。其中,所述重金屬樣本數據至少包括土壤中的目標重金屬含量數據和采樣點位置信息。所述環境協變數據包括土壤理化性質、環境影響因子、社會經濟影響因子。所述目標重金屬包括cd、pb、hg和as
4、對各初始樣本數據集進行預處理得到對應的研究樣本數據集。所述預處理中包括篩選得到有效環境影響變量。
5、獲取各目標重金屬的污染風險指標,作為重金屬風險分區分級模型的分類標簽。
6、將各研究樣本數據集混合后,隨機劃分為訓練集、測試集。
7、根據所述分類標簽、所述訓練集、所述測試集,并基于隨機森林模型建立重金屬風險分區分級模型。
8、基于所述重金屬風險分區分級模型,根據研究區域內的未知區域對應的所述有效環境影響變量,對研究區域的土壤重金屬污染風險進行識別與分區。
9、根據本申請的實施方式,所述土壤理化性質包括土壤ph值、土壤有機質。
10、所述環境影響因子包括土壤類型、土地利用類型、植被覆蓋、高程、坡度、坡向、大氣沉降、平均風速、平均降水、交通路網、水系分布。
11、所述社會經濟影響因子包括人均gdp、人口密度分布以及重金屬企業地理位置。
12、所述環境協變數據還包括基于交通路網、水系分布和重金屬企業地理位置確定三者與采樣點之間的距離。
13、根據本申請的實施方式,所述基于交通路網、水系分布和重金屬企業地理位置確定三者與采樣點之間的距離的步驟包括:
14、根據重金屬企業名稱基于行政區劃的模糊匹配,得到重金屬企業的地理位置信息。
15、將重金屬企業的地理位置信息轉化為基于行政區劃的矢量數據。
16、基于交通路網、水系分布和重金屬企業對應的矢量數據,確定采樣點到三者之間的距離。
17、根據本申請的實施方式,所述對初始樣本數據集進行預處理得到研究樣本數據集的步驟包括:
18、對所述初始樣本數據集進行數據缺失值插補,得到一次樣本數據集。
19、對一次樣本數據集中的不同變量進行特征縮放,得到二次樣本數據集。
20、對所述二次樣本數據集進行降維處理以及獨立性檢驗,將確定有效環境影響變量對應的樣本數據集作為研究樣本數據集。
21、根據本申請的實施方式,所述研究樣本數據集中的每個樣本數據還包括第一電離能和區域背景值。
22、根據本申請的實施方式,有效環境影響變量包括酸堿度、有機碳、人口、溫度、土地利用類型、土壤母質、高程、坡度、坡向、母巖、植被歸一化指數、pm2.5、碳排放、人均gdp、降雨量、年均風速,采樣點與水系分布之間的距離、采樣點與交通路網之間的距離以及采樣點與重金屬企業的距離。
23、根據本申請的實施方式,所述獲取各目標重金屬的污染風險指標的方法包括:
24、基于下述計算公式確定污染風險指標:
25、
26、式中,為潛在生態風險因素,為目標重金屬i的污染指數,tir為目標重金屬i的毒性響應參數,ci為目標重金屬i的目標重金屬含量數據,cb為目標重金屬i的土壤環境背景值,ri為總的潛在生態風險指數。
27、根據本申請的實施方式,根據所述分類標簽、所述訓練集、所述測試集,并基于隨機森林模型建立重金屬風險分區分級模型的步驟包括:
28、根據所述訓練集采用網格搜索法和5折交叉驗證確定所述隨機森林模型中的超參數,得到重金屬風險分區分級模型。所述隨機森林模型的最大深度為10~50。所述隨機森林模型的樹數量為1~150、所述隨機森林模型中節點分裂所需最小樣本數為2~15。
29、采用所述測試集對所述重金屬風險分區分級模型進行評價。
30、根據本申請的實施方式,基于所述訓練集對重金屬風險分區分級模型進行評價的步驟包括:
31、根據準確率、精確率、召回率、f1值、roc曲線和auc,基于所述訓練集對重金屬風險分區分級模型進行評價。
32、根據本申請的實施方式,還包括:
33、對研究區域的土壤重金屬污染風險進行識別與分區的結果進行空間可視化。
34、上述的基于機器學習的土壤重金屬污染風險分區分級方法中,基于有效環境影響變量和土壤重金屬含量的映射關系以及不同等級重金屬污染風險數據作為風險分類組合模型的二元標簽,精準識別重金屬潛在污染風險區域。同時利用模型可解釋性量化不同重金屬污染的關鍵因素以及不同程度污染風險的污染差異。該方法從定量、定性并以多角度識別土壤重金屬污染風險,實現土壤重金屬潛在污染風險區域科學劃分。
本文檔來自技高網...【技術保護點】
1.一種基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述土壤理化性質包括土壤pH值、土壤有機質;
3.根據權利要求2所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述基于交通路網、水系分布和重金屬企業地理位置確定三者與采樣點之間的距離的步驟包括:
4.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述對初始樣本數據集進行預處理得到研究樣本數據集的步驟包括:
5.根據權利要求4所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述研究樣本數據集中的每個樣本數據還包括第一電離能和區域背景值。
6.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,有效環境影響變量包括酸堿度、有機碳、人口、溫度、土地利用類型、土壤母質、高程、坡度、坡向、母巖、植被歸一化指數、PM2.5、碳排放、人均GDP、降雨量、年均風速,采樣點與水系分布之間
7.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述獲取各目標重金屬的污染風險指標的方法包括:
8.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,根據所述分類標簽、所述訓練集、所述測試集,并基于隨機森林模型建立重金屬風險分區分級模型的步驟包括:
9.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,基于所述訓練集對重金屬風險分區分級模型進行評價的步驟包括:
10.根據權利要求1~9中任一項所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,還包括:
...【技術特征摘要】
1.一種基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述土壤理化性質包括土壤ph值、土壤有機質;
3.根據權利要求2所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述基于交通路網、水系分布和重金屬企業地理位置確定三者與采樣點之間的距離的步驟包括:
4.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述對初始樣本數據集進行預處理得到研究樣本數據集的步驟包括:
5.根據權利要求4所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,所述研究樣本數據集中的每個樣本數據還包括第一電離能和區域背景值。
6.根據權利要求1所述的基于機器學習的土壤重金屬污染風險分區分級方法,其特征在于,有效環境影響變量包括酸...
【專利技術屬性】
技術研發人員:廖騏,余霖,楊志輝,楊衛春,李青竹,司夢瑩,李坤,
申請(專利權)人:中南大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。