System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及巖土數據擴充技術,具體涉及一種基于變分自編碼器的巖土采樣數據增強方法。
技術介紹
1、現有的土壤力學技術主要依賴于傳統的實驗方法和統計模型來評估土壤特性。這些方法包括直接剪切試驗和三軸剪切試驗,雖然能夠測量土壤的抗剪強度,但由于實驗周期長、成本高,而且對環境條件敏感,導致數據獲取困難、實驗數據量不足。傳統的統計模型,如線性回歸,在處理復雜的土壤特征時,往往因無法捕捉非線性關系而表現不佳。此外,當前的機器學習方法在處理土壤數據時,也面臨一些挑戰,如數據稀缺、模型過擬合和泛化能力不足。
2、為了改善土壤力學研究中的這些問題,近期有研究嘗試使用人工神經網絡、支持向量機、高斯過程回歸等機器學習技術。然而,這些方法在處理小數據集時容易過擬合,且在面對多樣化土壤特征時表現有限。
技術實現思路
1、針對現有技術中的上述不足,本專利技術提供的基于變分自編碼器的巖土采樣數據增強方法現有技術通過實驗獲取大量土壤數據進行機器學習,存在數據獲取難度大、成本高的問題。
2、為了達到上述專利技術目的,本專利技術采用的技術方案為:
3、提供一種基于變分自編碼器的巖土采樣數據增強方法,其包括步驟:
4、s1、獲取包括若干樣本的數據集,并對數據集中的土壤數據進行預處理;每個樣本包括多種類型的巖土數據;
5、s2、將預處理后的數據集輸入已訓練的vae生成模型進行數據增強,得到重構數據;
6、s3、對重構數據進行區間限定,以更新數據集
7、s4、將重構數據中的任一土壤數據作為預測項,之后將重構數據中非預測項輸入已訓練的回歸模型,得到回歸預測數據;
8、s5、采用預測項和回歸預測數據更新一致性損失項,并根據一致性損失項、物理性質損失項,更新vae生成模型的總損失函數;
9、s6、將迭代次數累加一次,并判斷迭代次數是否大于等于預設次數,若是,輸出最近一次迭代時的重構數據,否則返回步驟s2。
10、進一步地,所述物理性質損失項的表達式為:
11、
12、其中,為物理性質損失項;α為控制約束的重要性;m為重構數據中樣本的總個數;xi2為第i個樣本中的預測項;xmax和xmin分別為重構數據的所有樣本的預測項中的最大和最小值;max(.)為取最大值函數;
13、所述一致性損失項的表達式為:
14、
15、其中,為一致性損失項;為回歸模型相對于第i個樣本中預測項的回歸預測數據。
16、vae生成模型的總損失函數的表達式為:
17、
18、其中,為總損失;為vae損傷函數。
19、進一步地,所述vae損傷函數的表達式為:
20、
21、其中,β為用于平衡重構損失和kl散度的超參數;為數據集與解碼器生成的重構數據之間的相似度;pθ(x|z)為解碼器從潛在空間的樣本中重構原始數據的概率分布;qφ(z|x)為編碼器將輸入數據映射到潛在空間的概率分布;p(z)為嵌入空間的先驗分布;dkl(qφ(z|x)||p(z))為qφ(z|x)和p(z)之間的差異度;x為數據集;z為潛在變量;為編碼器網絡參數;θ為解碼器網絡參數;和分別為潛在變量的均值和方差;μθ(z)和分別為重構數據的均值和方差;為標準正態分布。
22、進一步地,多種類型的巖土數據包括測量點的深度、有效應力、標準化不排水抗剪程度、超固結比、標準化錐尖阻力、標準化有效錐尖阻力、標準化超靜孔隙水壓和孔隙壓力比;所述預測項為標準化不排水抗剪強度。
23、進一步地,標準化錐尖阻力f1、標準化有效錐尖阻力f2、標準化超靜孔隙水壓q1和孔隙壓力比q2的表達式分別為:
24、
25、其中,qt為錐尖阻力;σv為垂直應力;σv′為有效應力;u2為孔隙水壓力;u0為初始孔隙水壓力。
26、進一步地,對數據集中的土壤數據進行預處理包括依次對樣本進行缺失值處理、異常值處理和數據格式統一。
27、進一步地,所述數據集為issmge?tc304土壤數據庫中的clay/6/535數據集;所述回歸模型為gpr回歸模型。
28、進一步地,所述vae生成模型的編碼器和解碼器均包括五層全連接神經網絡;所述編碼器的前面四層全連接神經網絡的輸出依次經過批量歸一化層和dropout層后進入下一層全連接神經網絡;所述解碼器前面兩層全連接神經網絡的輸出經過批量歸一化層后,進入下一層全連接神經網絡。
29、本專利技術的有益效果為:本方案通過vae生成模型來解決數據稀缺性,增強數據集的規模和多樣性,并提高機器學習模型的泛化能力。通過利用vae生成模型可以得到更多符合原始數據分布的新數據,通過生成的數據進行模型訓練,可以改善模型的預測精度,并減緩過擬合風險。
30、vae生成模型的多樣化數據有助于更準確地捕捉土壤特性中的非線性關系,從而提高模型的性能和穩定性。vae生成模型生成的數據與原始數據分布相似,可以在數據傳輸和處理過程中更好地保護原始數據。這種方式既可以擴充數據集,又不需要將原始數據外泄,從而提高數據安全性。
31、再者,通過vae生成額外的數據,可以減少實地測試和實驗室實驗的需求;這意味著在進行機器學習模型訓練時,無需再投入大量資源進行實驗,這在資源受限的環境中尤為重要。
本文檔來自技高網...【技術保護點】
1.基于變分自編碼器的巖土采樣數據增強方法,其特征在于,包括步驟:
2.根據權利要求1所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,所述物理性質損失項的表達式為:
3.根據權利要求2所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,所述VAE損傷函數的表達式為:
4.根據權利要求1所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,多種類型的巖土數據包括測量點的深度、有效應力、標準化不排水抗剪程度、超固結比、標準化錐尖阻力、標準化有效錐尖阻力、標準化超靜孔隙水壓和孔隙壓力比;所述預測項為標準化不排水抗剪強度。
5.根據權利要求4所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,標準化錐尖阻力f1、標準化有效錐尖阻力f2、標準化超靜孔隙水壓q1和孔隙壓力比q2的表達式分別為:
6.根據權利要求4所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,對數據集中的土壤數據進行預處理包括依次對樣本進行缺失值處理、異常值處理和數據格式統一。
7.根據權利要求1-6任一所述的基于變分
8.根據權利要求1-6任一所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,所述VAE生成模型的編碼器和解碼器均包括五層全連接神經網絡;所述編碼器的前面四層全連接神經網絡的輸出依次經過批量歸一化層和Dropout層后進入下一層全連接神經網絡;所述解碼器前面兩層全連接神經網絡的輸出經過批量歸一化層后,進入下一層全連接神經網絡。
...【技術特征摘要】
1.基于變分自編碼器的巖土采樣數據增強方法,其特征在于,包括步驟:
2.根據權利要求1所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,所述物理性質損失項的表達式為:
3.根據權利要求2所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,所述vae損傷函數的表達式為:
4.根據權利要求1所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,多種類型的巖土數據包括測量點的深度、有效應力、標準化不排水抗剪程度、超固結比、標準化錐尖阻力、標準化有效錐尖阻力、標準化超靜孔隙水壓和孔隙壓力比;所述預測項為標準化不排水抗剪強度。
5.根據權利要求4所述的基于變分自編碼器的巖土采樣數據增強方法,其特征在于,標準化錐尖阻力f1、標準化有效錐尖阻力f2、標準化超靜孔隙水壓q1和孔隙壓力比q2...
【專利技術屬性】
技術研發人員:王歡,陳政彬,張騰云,余杰,馮旭,李之淋,邱皓,雍怡峰,馮仁杰,
申請(專利權)人:中國水利水電第七工程局有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。