System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及隧道突涌水安全評估,具體涉及一種隧道突涌水災害預測方法、設備及存儲介質。
技術介紹
1、傳統的隧道突水災害預測方法包括層次分析法、綜合評價法、加權平均法以及專家評判法等,這些方法的主觀性較強且適用性差,加之隧道施工過程中水文地質條件復雜,難以全部探清,而一線施工人員技術儲備不足時容易導致難以準確預測隧道突水災害,可能造成嚴重的經濟損失和人員傷亡。在現有技術中,機器學習可以用于處理復雜的數據。近年來,隨著機器學習預測模型的發展,越來越多的研究者們將其應用到數據分析及災害預測領域中。
2、機器學習中,預測主要包括三個部分:數據預處理、模型訓練和預測,在進行機器學習任務之前,需要對原始數據進行處理,轉換成可以用于機器學習的數據,以提高機器學習的準確性。而機器學習的模型種類眾多,不同模型的學習能力與適應性參差不齊。因此,在建立隧道突水災害風險智能預測模型時,需要根據實際情況進行選擇,應該考慮到特征的數量和樣本集的大小等因素,對模型進行評估,選擇一個簡單且易于訓練的模型,并能夠避免出現過擬合或欠擬合問題。
3、模型的預測精度受多種因素影響,包括數據集的大小、數據集特征分布、數據集劃分方式以及模型復雜度等。對于給定的模型和數據集,通常情況下,訓練集越大,模型的準確率可能會越高,然而訓練集比例越大,對模型及計算載體的配置要求會更高,當訓練集比例過大時,同樣會導致過擬合的問題,因此,需要根據預測類型選擇合適的訓練集比例。
4、同時,以往的研究者們在進行隧道突水災害預測時,大多只使用了較為單一的傳
5、因此,開發一種隧道突涌水災害預測方法、設備及存儲介質,不但具有迫切的研究價值,也具有良好的經濟效益和工業應用潛力,這正是本專利技術得以完成的動力所在和基礎。
技術實現思路
1、為了克服上述所指出的現有技術的缺陷,本專利技術人對此進行了深入研究,在付出了大量創造性勞動后,從而完成了本專利技術。
2、具體而言,本專利技術提出一種基于算法優化的隧道突水智能預測方法對隧道突水災害進行快速準確預測,以解決預測精度不夠且模型單一的技術問題。
3、為實現上述目的,本專利技術提供如下技術方案:
4、一種隧道突涌水災害預測方法,包括:
5、s1:基于隧道突涌水災害案例構建數據集,分析并選取致災因子,明確災害分級標準;
6、s2:將數據集以既定比例關系劃分為訓練集及測試集;
7、s3:以致災因子作為特征變量,對數據集中訓練集及測試集分別進行數據預處理;
8、s4:選取精確率、召回率和f1分數作為學習模型的評價指標,以預處理數據訓練機器學習模型,優化模型超參數后,進行重復訓練,篩選適配機器學習單模型;
9、s5:采用stacking集成方法對機器學習模型進行改進,以適配的單模型作為第一層基學習器,以線性回歸和嶺回歸作為第二層元學習器,對單模型進行超參數調優,測試并比對基學習器及元學習器不同組合方式下的多組集成模型的預測效果;
10、s6:以評價指標及混淆矩陣比對最優單模型及最優集成模型,獲取最優集成模型評價準確性。
11、在本專利技術中,作為一種改進,分析并選取致災因子,明確災害分級標準包括:
12、統計數據集中影響因素的出現頻次,以高頻次影響因素作為預測評價用致災因子;
13、以致災因子對隧道突涌水的影響劃分致災因子影響等級。
14、在本專利技術中,作為一種改進,對數據集進行數據預處理包括:
15、將致災因子區分為定性變量及定量變量,并將其分開進行數值化處理。其中,定量變量及定性變量分別以對應的致災因子影響等級賦值
16、采用箱線圖法對特征變量進行離群值檢測;
17、對數據進行離群值替換與缺失值補充。其中,對于同一變量在不同危險等級下的離群值替換過程,定性變量取其當前危險等級下的數據的眾數作為離群值的替換值;對于定量變量,取其當前危險等級下數據的平均值作為離群值的替換值。對于數據集中缺失數據的補充方法,定性變量取其影響等級下數據的眾數作為缺失數據的補充值;定量變量取其影響等級下數據的平均值作為缺失數據的補充值。
18、對離群值處理完畢的數據集進行歸一標準化處理。
19、在本專利技術中,作為一種改進,以預處理數據訓練機器學習模型,優化模型超參數后,進行重復訓練,篩選適配機器學習單模型包括:
20、選取多個機器學習模型作為訓練模型,將預處理后的訓練集和測試集輸入單機器學習模型;
21、通過k折交叉驗證結合網格搜索調參法,對機器學習模型進行超參數調優,得到模型的最優超參數取值,輸入模型超參數,重新訓練模型,對超參數優化前后各單模型評價指標進行對比,選擇最優的n種適配機器學習單模型。
22、在本專利技術中,作為一種改進,第二層元學習器中線性回歸和嶺回歸采用超參數調優法獲取兩種元學習器的最優超參數。
23、在本專利技術中,作為一種改進,采用stacking集成對學習模型進行改進具體包括:
24、集成學習模型以n種基學習器和兩種元學習器組合形成至少m組集成模型組合;
25、以訓練集和測試集數據訓練m組集成模型,得到隧道突水災害預測結果以及各模型的評價指標;
26、對m組集成模型中精確率值、召回率值和f1分數值均在0.80以上的集成模型組合重新輸入最優超參數進行模型訓練;
27、對超參數調優前后的集成模型組合評價指標進行對比,得出最優stacking集成模型。
28、在本專利技術中,作為一種改進,所述集成模型組合方式為一種或多種基學習器與其中任意一種元學習器構成的集成模型。
29、一種計算機設備,包括存儲器、處理器及通訊組件;
30、其中,存儲器被配置為存儲一條或多條指令;
31、處理器由通訊組件加載并執行存儲器指令,以完成權利要求1-6中任意一項所述預測方法。
32、一種計算機可讀存儲介質,所述可讀存儲介質中存儲有可執行指令,所述可執行指令由處理器加載并執行以實現如權利要求1-6任一所述的預測方法。
33、與現有技術相比,本專利技術的有益效果是:
34、(1)利用機器學習方法進行隧道突水災害智能預測,可以避免傳統預測方法的主觀性強及適用性差等問題,同時避免技術人員所導致的災害誤判漏判,其次,本專利技術通過集成模型的方法,對模型進行改進并優化算法,可以快速準確地對隧道突水災害進行預測,提升模型性能和預測精度。
35、(2)本專利技術中,以stacking集成模型,采取分類預測方法應用于突涌水預測中,不同于以往的本文檔來自技高網...
【技術保護點】
1.一種隧道突涌水災害預測方法,其特征在于,包括:
2.根據權利要求1所述的隧道突涌水災害預測方法,其特征在于,分析并選取致災因子,明確災害分級標準包括:
3.根據權利要求2所述的隧道突涌水災害預測方法,其特征在于,對數據集進行數據預處理包括:
4.根據權利要求4所述的隧道突涌水災害預測方法,其特征在于,對數據進行離群值替換與缺失值補充包括:
5.根據權利要求1所述的隧道突涌水災害預測方法,其特征在于,以預處理數據訓練機器學習模型,優化模型超參數后,進行重復訓練,篩選的適配機器學習單模型包括:
6.根據權利要求1所述的隧道突涌水災害預測方法,其特征在于:第二層元學習器中線性回歸和嶺回歸采用超參數調優法獲取兩種元學習器的最優超參數。
7.根據權利要求1所述的隧道突涌水災害預測方法,其特征在于:采用Stacking集成學習方法對機器學習模型進行改進具體包括:
8.根據權利要求6所述的隧道突涌水災害預測方法,其特征在于:所述集成模型組合方式為一種或多種基學習器與其中任意一種元學習器構成的集成模型。
>9.一種計算機設備,其特征在于:包括存儲器、處理器及通訊組件;
10.一種計算機可讀存儲介質,其特征在于:所述可讀存儲介質中存儲有可執行指令,所述可執行指令由處理器加載并執行以實現如權利要求1-6任一所述的預測方法。
...【技術特征摘要】
1.一種隧道突涌水災害預測方法,其特征在于,包括:
2.根據權利要求1所述的隧道突涌水災害預測方法,其特征在于,分析并選取致災因子,明確災害分級標準包括:
3.根據權利要求2所述的隧道突涌水災害預測方法,其特征在于,對數據集進行數據預處理包括:
4.根據權利要求4所述的隧道突涌水災害預測方法,其特征在于,對數據進行離群值替換與缺失值補充包括:
5.根據權利要求1所述的隧道突涌水災害預測方法,其特征在于,以預處理數據訓練機器學習模型,優化模型超參數后,進行重復訓練,篩選的適配機器學習單模型包括:
6.根據權利要求1所述的隧道突涌水災害預測方法,其特征在...
【專利技術屬性】
技術研發人員:萬飛,張念,盧佳樂,唐一豐,牛萌萌,王耀耀,周彩鳳,
申請(專利權)人:交通運輸部公路科學研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。