System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及化工和機器學習,具體涉及一種基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法。
技術(shù)介紹
1、二氧化碳的捕集與存儲技術(shù)是應(yīng)對全球氣候變暖的重要手段之一,對于實現(xiàn)“碳達峰、碳中和”目標具有關(guān)鍵意義。在co2的捕集過程中,吸收劑的選擇至關(guān)重要,其中低共熔溶劑(des)因其環(huán)境友好、可設(shè)計性強、對co2溶解度高等特性,成為了研究的熱點。然而,通過實驗手段逐一測定co2在不同低共熔溶劑中的溶解度存在一系列繁瑣的問題,包括復雜的實驗條件、耗時的操作流程以及高昂的實驗成本。此外,由于低共熔溶劑種類繁多,分子結(jié)構(gòu)復雜,進一步增加了實驗測定的難度和復雜性。
2、傳統(tǒng)實驗方法不僅效率低下,且難以全面覆蓋所有可能的低共熔溶劑組合及反應(yīng)條件,限制了低共熔溶劑在co2捕集領(lǐng)域的廣泛應(yīng)用。因此,亟需一種高效、經(jīng)濟、可靠的方法來預(yù)測co2在不同低共熔溶劑中的溶解度,以加速優(yōu)良低共熔溶劑的探索和開發(fā)。
3、機器學習作為人工智能的重要分支,近年來在化學性質(zhì)預(yù)測領(lǐng)域展現(xiàn)出巨大潛力。機器學習模型能夠識別和利用數(shù)據(jù)中的非線性關(guān)系和復雜模式,超越傳統(tǒng)統(tǒng)計方法的局限性,有效處理多變量和高維數(shù)據(jù)。此外,機器學習模型還具備強大的適應(yīng)性和泛化能力,能夠在未見過的情境中進行準確預(yù)測,為化學性質(zhì)的廣泛預(yù)測提供了新方法。
4、現(xiàn)有技術(shù)中往往采用單一模型而未通過比較不同模型在預(yù)測co2在低共熔溶劑中溶解度方面的表現(xiàn)。不同的機器學習模型在處理特定類型的數(shù)據(jù)和任務(wù)時,會展現(xiàn)出不同的性能表現(xiàn)。例如,某些模型可能更擅長處理線性關(guān)系,而另
5、不同機器學習模型的泛化能力也有所不同。泛化能力是指模型在新數(shù)據(jù)上表現(xiàn)良好的能力。在預(yù)測co2在低共熔溶劑中的溶解度時,模型的泛化能力尤為重要,因為它直接影響到模型在不同反應(yīng)條件下的預(yù)測準確性。
6、低共熔溶劑種類繁多,分子結(jié)構(gòu)復雜,不同溶劑對co2的溶解度可能受到多種因素的影響。采用多種機器學習模型可以更全面地適應(yīng)不同類型的低共熔溶劑及其與co2的相互作用,提高預(yù)測的準確性和可靠性。
7、不同的機器學習模型在捕捉數(shù)據(jù)特征方面各有側(cè)重。例如,隨機森林(rf)通過構(gòu)建多棵決策樹來實現(xiàn)分類或回歸任務(wù),擅長處理具有交互作用的數(shù)據(jù);而深度神經(jīng)網(wǎng)絡(luò)(dnn)和卷積神經(jīng)網(wǎng)絡(luò)(cnn)則能夠自動提取和學習數(shù)據(jù)中的深層特征,適用于處理高度復雜的數(shù)據(jù)。通過組合使用這些模型,可以充分利用它們各自的優(yōu)勢,提高預(yù)測的準確性和穩(wěn)定性。
8、基于此,采用不同的機器學習模型進行co2在低共熔溶劑中溶解度預(yù)測,對于提高預(yù)測準確性、穩(wěn)定性和泛化能力、驗證不同算法在特定任務(wù)上的表現(xiàn)并分散預(yù)測風險具有重要的意義。
技術(shù)實現(xiàn)思路
1、為解決
技術(shù)介紹
中存在的問題,本專利技術(shù)提供一種基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其包括如下的步驟:
2、s1,數(shù)據(jù)收集:收集溶解度范圍為0.0014-0.0326的co2溶解度數(shù)據(jù)點,至少覆蓋13種低共熔溶劑,數(shù)據(jù)集被隨機分為訓練集和測試集,訓練集占總數(shù)據(jù)的80%,測試集占總數(shù)據(jù)的20%;
3、s2、低共熔溶劑分子結(jié)構(gòu)編碼;
4、s3、模型構(gòu)建、訓練與評估;
5、s4、結(jié)果分析與模型選擇:比較不同模型的預(yù)測性能,選擇最優(yōu)模型;
6、s5、利用訓練好的最優(yōu)模型預(yù)測不同條件下co2在低共熔溶劑中的溶解度。
7、優(yōu)選的方案中,步驟s1中,數(shù)據(jù)集的溫度范圍為293.15至323.15k,壓力范圍為0.515至5.842bar。
8、優(yōu)選的方案中,所述步驟s2的具體步驟包括:
9、s21.選擇工具:
10、選擇開源化學信息學軟件包rdkit作為獲取低共熔溶劑結(jié)構(gòu)編碼的工具;rdkit是一個開源的python化學信息學工具包,廣泛用于化學結(jié)構(gòu)數(shù)據(jù)的處理和計算;
11、s22.獲取結(jié)構(gòu)編碼:
12、將低共熔溶劑的分子結(jié)構(gòu)作為輸入;這些分子結(jié)構(gòu)可以通過各種化學數(shù)據(jù)庫、文獻或?qū)嶒灁?shù)據(jù)獲得;利用rdkit的多種函數(shù)和類來處理分子結(jié)構(gòu),包括讀取smiles字符串、解析sdf文件;
13、通過rdkit的內(nèi)置算法,為每種低共熔溶劑生成相應(yīng)的結(jié)構(gòu)編碼;結(jié)構(gòu)編碼是對分子結(jié)構(gòu)的一種數(shù)字化表示,便于計算機處理和分析;
14、s23.轉(zhuǎn)化特征描述符:
15、將生成的結(jié)構(gòu)編碼進一步轉(zhuǎn)化為特征描述符;這一步是將復雜的分子結(jié)構(gòu)信息簡化為一系列數(shù)值特征,以便機器學習算法能夠理解和處理;每種低共熔溶劑的結(jié)構(gòu)編碼被轉(zhuǎn)化為280個特征描述符;這些描述符全面覆蓋了分子的多個方面,確保能夠充分表達分子結(jié)構(gòu)的復雜性和多樣性;
16、s24.數(shù)據(jù)預(yù)處理:
17、對生成的特征描述符進行標準化和歸一化處理,以確保不同特征之間具有可比性,并消除量綱的影響;檢查特征描述符中是否存在異常值或缺失值,并進行相應(yīng)的處理,填充缺失值或剔除異常數(shù)據(jù)。
18、優(yōu)選的方案中,所述步驟s3包括采用四種機器學習算法來構(gòu)建模型的步驟s31,其中四種機器學習算法為:xgboost算法、隨機森林rf算法、深度神經(jīng)網(wǎng)絡(luò)dnn算法和卷積神經(jīng)網(wǎng)絡(luò)cnn算法,其中:
19、xgboost算法采用極致梯度提升樹方法,通過集成多個cart回歸樹來增強分類能力;xgboost將多個cart回歸樹有機組合,形成一個分類器;通過不斷添加樹,每棵新樹都會修正前面樹的預(yù)測誤差;模型通過貪心算法對決策樹進行分區(qū),并通過泰勒展開式對損失函數(shù)進行二次近似,同時引入正則化項以控制模型復雜度并防止過擬合;
20、隨機森林rf算法通過將多個決策樹融合,實現(xiàn)分類與回歸功能;rf通過自助抽樣構(gòu)建多個決策樹,并在每個樹的生成過程中僅使用部分特征進行節(jié)點分割,以增強模型的多樣性和抗過擬合能力;rf的輸出是所有樹預(yù)測結(jié)果的平均值;
21、深度神經(jīng)網(wǎng)絡(luò)dnn算法通過多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),處理復雜的非線性關(guān)系;dnn包含輸入層、多個隱藏層和輸出層,每一層由多個神經(jīng)元組成,并通過權(quán)重和偏置連接;dnn通過反向傳播算法和梯度下降法優(yōu)化參數(shù),以最小化預(yù)測誤差;
22、卷積神經(jīng)網(wǎng)絡(luò)cnn算法通過卷積層和池化層提取圖像或數(shù)據(jù)中的特征,cnn模擬人腦視覺皮層處理機制,采用局部感受野、權(quán)值共享和池化操作特性,有效降低網(wǎng)絡(luò)復雜度并穩(wěn)定學習效果,通過卷積核在輸入數(shù)據(jù)上滑動,提取特征并傳遞給后續(xù)層進行處理。
23、優(yōu)選的方案中,所述步驟s31中,還包括以下過程:
24、采用網(wǎng)格搜索方法結(jié)合k折交叉驗證對模型進行超參數(shù)進行優(yōu)化:其中網(wǎng)格搜索方法包括通過遍歷預(yù)設(shè)的超參數(shù)空間,尋找最優(yōu)的超參數(shù)組合;k折交叉驗證包括將數(shù)據(jù)集分為k個子集,每次選擇其中k-1個子集作為訓練集,剩余1個子集作為驗證集,重復k次,以評估模型本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,其包括如下的步驟:
2.根據(jù)權(quán)利要求1所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于:步驟S1中,數(shù)據(jù)集的溫度范圍為293.15至323.15K,壓力范圍為0.515至5.842bar。
3.根據(jù)權(quán)利要求2所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于:所述步驟S2的具體步驟包括:
4.根據(jù)權(quán)利要求1所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,所述步驟S3包括采用四種機器學習算法來構(gòu)建模型的步驟S31,其中四種機器學習算法為:XGBoost算法、隨機森林RF算法、深度神經(jīng)網(wǎng)絡(luò)DNN算法和卷積神經(jīng)網(wǎng)絡(luò)CNN算法,其中:
5.根據(jù)權(quán)利要求4所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,所述步驟S31中,還包括以下過程:
6.根據(jù)權(quán)利要求4所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,所述步驟S3中,還包括模型訓練與
7.根據(jù)權(quán)利要求6所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,步驟S321的具體過程包括:
8.根據(jù)權(quán)利要求6所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,步驟S322的具體過程包括:
9.根據(jù)權(quán)利要求8所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,步驟S4的具體過程如下:
10.根據(jù)權(quán)利要求9所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,步驟S5的具體過程如下:
...【技術(shù)特征摘要】
1.一種基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,其包括如下的步驟:
2.根據(jù)權(quán)利要求1所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于:步驟s1中,數(shù)據(jù)集的溫度范圍為293.15至323.15k,壓力范圍為0.515至5.842bar。
3.根據(jù)權(quán)利要求2所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于:所述步驟s2的具體步驟包括:
4.根據(jù)權(quán)利要求1所述的基于機器學習模型的二氧化碳在低共熔溶劑中溶解度預(yù)測方法,其特征在于,所述步驟s3包括采用四種機器學習算法來構(gòu)建模型的步驟s31,其中四種機器學習算法為:xgboost算法、隨機森林rf算法、深度神經(jīng)網(wǎng)絡(luò)dnn算法和卷積神經(jīng)網(wǎng)絡(luò)cnn算法,其中:
5.根據(jù)權(quán)利要求4所述的基于機器學習模型的二...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉彬,于亞男,賈成梁,田文德,崔哲,孫素莉,
申請(專利權(quán))人:青島科技大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。