System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 久久青青草原亚洲av无码app,久久久久亚洲精品无码网址色欲,亚洲av成本人无码网站
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法技術(shù)

    技術(shù)編號:43754282 閱讀:10 留言:0更新日期:2024-12-20 13:10
    本發(fā)明專利技術(shù)公開了一種基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,廣泛收集實際數(shù)據(jù)并進(jìn)行預(yù)處理,利用LASSO回歸特征選擇方法對影響氯離子擴散系數(shù)的參數(shù)進(jìn)行選擇,防止回歸模型在訓(xùn)練集上的過擬合問題;在訓(xùn)練集上利用基于決策樹算法的分布式梯度提升算法(LightGBM)對氯離子擴散系數(shù)的若干參數(shù)進(jìn)行回歸分析,將得到預(yù)測值與原有參數(shù)進(jìn)行升維處理后的數(shù)據(jù)作為高斯過程回歸(GPR)的輸入,真實值作為輸出,訓(xùn)練GPR模型,分析GPR預(yù)測結(jié)果,并使用貝葉斯參數(shù)優(yōu)化方法構(gòu)建LightGBM?GPR模型。本發(fā)明專利技術(shù)方法既保留了LightGBM預(yù)測誤差小的特點又給出了不確定性概率區(qū)間,提高了對氯離子擴散系數(shù)的預(yù)測能力。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及混凝土氯離子擴散系數(shù)預(yù)測領(lǐng)域,特別涉及一種基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法


    技術(shù)介紹

    1、混凝土是一種由水泥、粗骨料和細(xì)骨料等組成的非均質(zhì)、多尺度結(jié)構(gòu)的材料,氯離子是導(dǎo)致混凝土結(jié)構(gòu)中鋼筋腐蝕的主要原因之一,當(dāng)氯離子通過擴散進(jìn)入混凝土內(nèi)部并達(dá)到鋼筋表面時,會破壞鋼筋的鈍化膜,導(dǎo)致鋼筋腐蝕,不同的混凝土配合比和材料選擇會顯著影響氯離子的擴散性能,研究氯離子擴散系數(shù),可以優(yōu)化混凝土的配合比和材料選擇,增強混凝土的抗氯離子侵蝕能力,耐久性差的混凝土結(jié)構(gòu)頻繁維修和更換不僅增加了資源的消耗,還對環(huán)境造成了負(fù)面影響,混凝土氯離子擴散系數(shù)的預(yù)測對混凝土結(jié)構(gòu)的耐久性設(shè)計具有重要意義。

    2、目前對于混凝土氯離子擴散系數(shù)的研究大多采傳統(tǒng)實驗方法,從混凝土中某些特殊物理結(jié)構(gòu)進(jìn)行分析,從某些含有特殊材料混凝土出發(fā),從某一齡期的混凝土的氯離子擴散系數(shù)角度出發(fā),部分已有方法對研究混凝土氯離子擴散系數(shù)研究提供了特定視角但可能面對適用性有限問題,但隨著計算機領(lǐng)域的飛速發(fā)展,特別是人工智能領(lǐng)域的發(fā)展,基于機器學(xué)習(xí)算法的混凝土氯離子擴散系數(shù)方法應(yīng)當(dāng)被更深地發(fā)掘,機器學(xué)習(xí)回歸預(yù)測僅需采集混凝土的各個特征參數(shù)即可做出預(yù)測,但一般單一機器學(xué)習(xí)回歸算法直接作用在混凝土氯離子擴散系數(shù)預(yù)測領(lǐng)域各有優(yōu)點,如有些算法精度較高而有些算法功能更強大,機器學(xué)習(xí)對于混凝土氯離子擴散系數(shù)的預(yù)測雖然整體精度高但難免存在誤差,復(fù)合的機器學(xué)習(xí)模型的預(yù)測誤差可能不僅不收斂反而會發(fā)散,不能揭示氯離子擴散系數(shù)的可能分布情況。


    技術(shù)實現(xiàn)思

    1、本專利技術(shù)所要解決的問題是:提供一種基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,通過融合lightgbm模型與gpr模型,解決了復(fù)合模型誤差不僅不收斂反而發(fā)散的問題,提高了混凝土氯離子擴散系數(shù)的預(yù)測精度。

    2、本專利技術(shù)采用如下技術(shù)方案:一種基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,包括如下步驟:

    3、步驟1、收集實測樣本數(shù)據(jù),并對樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗;

    4、步驟2、對清洗后的樣本數(shù)據(jù)進(jìn)行l(wèi)asso回歸特征選擇:將樣本數(shù)據(jù)潛在的特征變量放入lasso回歸中進(jìn)行處理,經(jīng)過交叉驗證后,選取均方誤差最小時對應(yīng)的潛在特征變量系數(shù),保留對目標(biāo)值有所貢獻(xiàn)的特征;

    5、步驟3、采用隨機抽樣進(jìn)行樣本數(shù)據(jù)的訓(xùn)練,構(gòu)建訓(xùn)練集和測試集;

    6、步驟4、構(gòu)建基于決策樹算法的分布式梯度提升算法(lightgbm),在訓(xùn)練集上訓(xùn)練lightgbm模型,并給出訓(xùn)練好的lightgbm模型在訓(xùn)練集和測試集上的預(yù)測值;

    7、步驟5、將lightgbm模型的預(yù)測值作為增加列,對訓(xùn)練集和測試集數(shù)據(jù)進(jìn)行升維處理;

    8、步驟6、構(gòu)建高斯過程回歸(gpr)模型,將升維后的測試集數(shù)據(jù)作為gpr模型的輸入,實測數(shù)據(jù)的真實值作為gpr模型的輸出,訓(xùn)練gpr模型;

    9、步驟7、分析gpr模型在訓(xùn)練集上的預(yù)測能力,通過貝葉斯參數(shù)優(yōu)化方法進(jìn)行g(shù)pr模型超參數(shù)的自動優(yōu)化,得到優(yōu)化后的gpr模型;

    10、步驟8、融合lightgbm模型與優(yōu)化后的gpr模型,得到lightgbm-gpr模型:將步驟5中升維處理后測試集的參數(shù)矩陣,作為優(yōu)化后的gpr模型的輸入,根據(jù)gpr模型的輸出得到lightgbm-gpr模型的預(yù)測結(jié)果;

    11、步驟9、對lightgbm-gpr模型的預(yù)測結(jié)果進(jìn)行整體評估,得到預(yù)測的氯離子擴散系數(shù)的數(shù)值和氯離子擴散系數(shù)的不確定性概率區(qū)間。

    12、具體地,步驟1中,原始數(shù)據(jù)中少量數(shù)據(jù)可能有空缺項,對于有空缺的數(shù)據(jù)可進(jìn)行刪除處理,原始數(shù)據(jù)中也可能有因為各種原因?qū)е聰?shù)據(jù)記錄錯誤,對于部分異常數(shù)據(jù),可以通過一些經(jīng)典數(shù)據(jù)清洗方法清除;

    13、比如:使用四分位距(iqr)方法,通過計算每個參數(shù)列的四分位距(iqr),將低于第1四分位數(shù)以下1.5倍iqr或高于第3四分位數(shù)1.5倍iqr的值視為異常值。

    14、又比如:使用標(biāo)準(zhǔn)分?jǐn)?shù)(z-score)法,將經(jīng)過空缺數(shù)據(jù)刪除操作后數(shù)據(jù)按參數(shù)列進(jìn)行標(biāo)準(zhǔn)化表現(xiàn)為z=(x-μ)/σ,其中,μ為每列均值,σ為每列標(biāo)準(zhǔn)差,將z-score絕對值大于3的異常值刪除。

    15、具體地,步驟2中,將lasso回歸特征選擇的目標(biāo)函數(shù)設(shè)置為:

    16、

    17、其中,yi為每行數(shù)據(jù)對應(yīng)的氯離子擴散系數(shù)真實值,xi為1行j列的行向量,它包含j個參數(shù)值,i為數(shù)據(jù)集中總數(shù)據(jù)數(shù),j為參數(shù)總數(shù),β為j行1列的列向量,它包含了對j種參數(shù)的賦值,λ為懲罰系數(shù),||||1為l1范數(shù);

    18、lasso回歸采用l1正則化,通過調(diào)整懲罰系數(shù)大小將冗余變量的稀疏系數(shù)壓縮至0從而實現(xiàn)特征篩選。

    19、具體地,步驟3中,為使訓(xùn)練時樣本均衡,提高模型性能,采用隨機抽樣進(jìn)行訓(xùn)練,可令訓(xùn)練樣本占總樣本數(shù)據(jù)量的80%,測試樣本占總樣本數(shù)據(jù)量的20%。

    20、具體地,步驟4中,對處理好的樣本數(shù)據(jù)在訓(xùn)練集上調(diào)用lightgbm模型,lightgbm模型訓(xùn)練好后即可根據(jù)訓(xùn)練集和測試集上數(shù)據(jù)的參數(shù)給出相應(yīng)預(yù)測值,lightgbm是對經(jīng)典算法梯度提升決策樹(gbdt)的優(yōu)化和高效實現(xiàn),在效果和原理方面,它有更快的訓(xùn)練效率。

    21、構(gòu)建lightgbm模型,基于histogram的決策樹算法,一個葉子節(jié)點的histogram可以直接由父節(jié)點的histogram和兄弟節(jié)點的histogram做差得到,大大提升訓(xùn)練速度,低內(nèi)存使用:lightgbm模型使用的是直方圖算法(histogram?algorithm),占用的內(nèi)存更低,數(shù)據(jù)分割的復(fù)雜度更低,更高的準(zhǔn)確率:lightgbm模型采用leaf-wise(按葉子生長)生長策略,每次從當(dāng)前所有葉子中找到分裂增益最大(一般也是數(shù)據(jù)量最大)的一個葉子,然后分裂,如此循環(huán),同xgboost的level-wise相比,在分裂次數(shù)相同的情況下,leaf-wise可以降低更多的誤差,得到更好的精度。

    22、進(jìn)一步地,lightgbm模型支持并行化學(xué)習(xí):包括支持特征并行和數(shù)據(jù)并行的兩種,針對這兩種并行方法都做了優(yōu)化。

    23、具體地,步驟5中,假設(shè)收集到的原始樣本數(shù)據(jù)經(jīng)過刪除缺損項和排除異常值后得到一張數(shù)據(jù)表,經(jīng)隨機抽樣后,以訓(xùn)練集為例,表為一張m行n+1列的矩陣,其中m為數(shù)據(jù)個數(shù),n為氯離子擴散系數(shù)的參數(shù)個數(shù),第n+1列為氯離子擴散系數(shù)的真實值,前n列每一列均為該列參數(shù)所對應(yīng)的值,在步驟2中經(jīng)過lasso回歸特征選擇后,假設(shè)數(shù)據(jù)表變?yōu)閙行q+1列的矩陣,其中q≤n,第q+1列仍為氯離子擴散系數(shù)的真實值,此時如果去掉最后一列真實值而只考慮參數(shù)數(shù)據(jù),可得m行q列的參數(shù)矩陣。

    24、此時,將lightgbm模型的預(yù)測值添加到參數(shù)矩陣的最后一列進(jìn)行數(shù)據(jù)升維操作,即對參數(shù)矩陣進(jìn)行列增廣操作,得到m行q+1列的參數(shù)矩陣,將lightgbm預(yù)測值作為參數(shù)加入,增加了gpr模型輸入的有效信息。

    25本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,包括如下步驟:

    2.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟1中,所述數(shù)據(jù)清洗包括:刪除缺損數(shù)據(jù)和排查異常數(shù)據(jù);所述排查異常數(shù)據(jù),方法包括:四分位距方法和標(biāo)準(zhǔn)分?jǐn)?shù)法。

    3.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟2中,所述LASSO回歸特征選擇,目標(biāo)函數(shù)設(shè)置如下:

    4.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟4中,所述LightGBM模型基于Histogram決策樹算法構(gòu)建,支持并行化學(xué)習(xí),一個葉子節(jié)點的Histogram由父節(jié)點的Histogram和兄弟節(jié)點的Histogram做差得到,并通過直方圖算法,采用Leaf-wise生長策略,每次從當(dāng)前所有葉子中找到分裂增益最大的葉子,進(jìn)行分裂和循環(huán);所述并行化學(xué)習(xí),包括特征并行學(xué)習(xí)和數(shù)據(jù)并行學(xué)習(xí)。

    5.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟5中,所述訓(xùn)練集和測試集分別為m行q列的參數(shù)矩陣,m為數(shù)據(jù)個數(shù),q為步驟2中經(jīng)過LASSO回歸特征選擇后氯離子擴散系數(shù)的參數(shù)個數(shù),對訓(xùn)練集和測試集的參數(shù)矩陣分別進(jìn)行列增廣操作,將步驟4中給出的LightGBM模型在訓(xùn)練集和測試集上的預(yù)測值,分別添加到訓(xùn)練集和測試集參數(shù)矩陣的最后一列,得到m行q+1列的參數(shù)矩陣。

    6.根據(jù)權(quán)利要求5所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟6中,所述GPR模型為高斯過程回歸模型,以高斯過程為基礎(chǔ),以正定協(xié)方差矩陣為核函數(shù),計算訓(xùn)練集的自相關(guān)性,基于貝葉斯框架得到測試集的后驗分布,輸出值和協(xié)方差函數(shù),計算出95%置信區(qū)間;

    7.根據(jù)權(quán)利要求6所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟7中,分析GPR模型在訓(xùn)練集上的預(yù)測能力,方法包括:比較均方誤差,均方根誤差和決定系數(shù),通過貝葉斯參數(shù)優(yōu)化方法進(jìn)行GPR模型超參數(shù)的自動優(yōu)化,通過使用一個代理模型來近似目標(biāo)函數(shù),所述代理模型包括高斯過程,根據(jù)已知的觀察數(shù)據(jù)進(jìn)行訓(xùn)練,捕捉目標(biāo)函數(shù)的行為,使用采集函數(shù)決定下一個參數(shù)的采樣位置,根據(jù)新的參數(shù)采樣結(jié)果更新代理模型和采集函數(shù),并重復(fù)更新過程,直到達(dá)到優(yōu)化目標(biāo)或達(dá)到停止條件,得到優(yōu)化后的GPR模型。

    8.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟8中,基于在訓(xùn)練集上經(jīng)過貝葉斯參數(shù)優(yōu)化后GPR模型,用訓(xùn)練好的LightGBM模型在測試集上給出預(yù)測值,并對測試集上的樣本數(shù)據(jù)進(jìn)行升維,作為優(yōu)化后的GPR模型的輸入,GPR模型的輸出為每個樣本數(shù)據(jù)對應(yīng)的氯離子擴散系數(shù)的預(yù)測均值與預(yù)測方差,計算出每個樣本數(shù)據(jù)對應(yīng)的預(yù)測置信區(qū)間,得到LightGBM-GPR模型的預(yù)測結(jié)果,包括對測試集上數(shù)據(jù)的點估計和不確定性概率區(qū)間的估計。

    9.一種電子設(shè)備,其特征在于,包括:

    10.一種計算機可讀存儲介質(zhì),其特征在于,其上存儲有計算機程序,該程序被處理器執(zhí)行時,實現(xiàn)權(quán)利要求1至8中任一項所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法中的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,包括如下步驟:

    2.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟1中,所述數(shù)據(jù)清洗包括:刪除缺損數(shù)據(jù)和排查異常數(shù)據(jù);所述排查異常數(shù)據(jù),方法包括:四分位距方法和標(biāo)準(zhǔn)分?jǐn)?shù)法。

    3.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟2中,所述lasso回歸特征選擇,目標(biāo)函數(shù)設(shè)置如下:

    4.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟4中,所述lightgbm模型基于histogram決策樹算法構(gòu)建,支持并行化學(xué)習(xí),一個葉子節(jié)點的histogram由父節(jié)點的histogram和兄弟節(jié)點的histogram做差得到,并通過直方圖算法,采用leaf-wise生長策略,每次從當(dāng)前所有葉子中找到分裂增益最大的葉子,進(jìn)行分裂和循環(huán);所述并行化學(xué)習(xí),包括特征并行學(xué)習(xí)和數(shù)據(jù)并行學(xué)習(xí)。

    5.根據(jù)權(quán)利要求1所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟5中,所述訓(xùn)練集和測試集分別為m行q列的參數(shù)矩陣,m為數(shù)據(jù)個數(shù),q為步驟2中經(jīng)過lasso回歸特征選擇后氯離子擴散系數(shù)的參數(shù)個數(shù),對訓(xùn)練集和測試集的參數(shù)矩陣分別進(jìn)行列增廣操作,將步驟4中給出的lightgbm模型在訓(xùn)練集和測試集上的預(yù)測值,分別添加到訓(xùn)練集和測試集參數(shù)矩陣的最后一列,得到m行q+1列的參數(shù)矩陣。

    6.根據(jù)權(quán)利要求5所述的基于混合機器學(xué)習(xí)模型的氯離子擴散系數(shù)預(yù)測方法,其特征在于,步驟6中...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:孫立顧金水馮攀張熠瑋李文佳
    申請(專利權(quán))人:東南大學(xué)溧陽研究院
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 精品人妻无码区二区三区| 狠狠躁天天躁中文字幕无码| 国产精品无码久久av不卡| 免费无码黄十八禁网站在线观看| 亚洲日韩精品无码专区网址| 亚洲国产精品无码久久久久久曰| 亚洲国产精品无码专区在线观看| 国产精品99久久久精品无码| 国产免费午夜a无码v视频| 丰满日韩放荡少妇无码视频| 无码AV一区二区三区无码| 中文字幕丰满乱子无码视频| 成人无码午夜在线观看| 久久午夜夜伦鲁鲁片无码免费| 日韩精品人妻系列无码av东京| 日韩免费a级毛片无码a∨| 国产成人午夜无码电影在线观看| 八戒理论片午影院无码爱恋| 曰产无码久久久久久精品| 久久久久亚洲av成人无码电影| 精品无码中出一区二区| 中文字幕无码日韩专区| 亚洲乱亚洲乱妇无码麻豆| 免费无码中文字幕A级毛片| 人妻无码久久中文字幕专区| 91久久九九无码成人网站| 亚洲av无码一区二区三区天堂| 精品人妻大屁股白浆无码| 亚洲AV无码专区在线亚| 无码人妻久久一区二区三区蜜桃| 免费一区二区无码视频在线播放| 精品无码国产自产拍在线观看蜜| 久久亚洲中文无码咪咪爱| 精品国产性色无码AV网站| 精品无码久久久久久尤物| 精品深夜AV无码一区二区老年| 在线精品自偷自拍无码中文| 无码人妻久久一区二区三区免费丨| 亚洲AV综合色区无码另类小说| 无码任你躁久久久久久| 久久久精品人妻无码专区不卡|