System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及納米材料高通量生態(tài)風(fēng)險(xiǎn)評(píng)估預(yù)測(cè),具體地說,尤其涉及一種用于生態(tài)風(fēng)險(xiǎn)評(píng)估的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法。
技術(shù)介紹
1、人工納米材料的水環(huán)境毒性評(píng)估主要沿用了化學(xué)品毒性評(píng)估的實(shí)驗(yàn)方法。例如,標(biāo)準(zhǔn)的經(jīng)濟(jì)合作與發(fā)展組織(organization?for?economic?co-operation?anddevelopment,oecd)生態(tài)毒性測(cè)試方法,包括藻類生長(zhǎng)毒性(oecd?201)、大型溞急性毒性(oecd?202)和魚類急性毒性(oecd?203)等。納米材料被定義為一個(gè)或多個(gè)外部維度尺寸位于1nm到100nm的材料。由于納米尺寸效應(yīng),納米材料具有許多獨(dú)特的物理化學(xué)性質(zhì),如比表面積大、表面能高等。
2、這些性質(zhì)既給納米材料帶來許多優(yōu)良的性能,也是影響納米材料毒性的重要因素。納米材料與傳統(tǒng)意義的化學(xué)品不完全相同,例如銀(ag)納米材料不能看作銀(ag)這一種物質(zhì)進(jìn)行毒性評(píng)估,因?yàn)槌叽纭⑿螤睢⒈砻嫘揎椈虬策@些物理化學(xué)性質(zhì)的改變,都可以影響銀(ag)的毒理學(xué)效應(yīng)。僅使用實(shí)驗(yàn)的方法,難以完成所有形態(tài)人工納米材料的毒性評(píng)估,需要采用更快速、有效的方法進(jìn)行人工納米材料的毒性評(píng)估。
3、計(jì)算毒理學(xué)方法,例如定量構(gòu)效關(guān)系(quantitative?structure-activityrelationship,qsar)模型被廣泛用于化學(xué)品的毒性評(píng)估。針對(duì)納米材料構(gòu)建的定量構(gòu)效關(guān)系模型,被稱為定量納米構(gòu)效關(guān)系(nano-qsar)模型。與定量構(gòu)效關(guān)系類似,定量納米構(gòu)效關(guān)系也遵循相似的納米
4、機(jī)器學(xué)習(xí)方法在計(jì)算毒理學(xué)中是一項(xiàng)不可或缺的分析手段。通過機(jī)器學(xué)習(xí)算法,不僅可以實(shí)現(xiàn)納米材料毒性的預(yù)測(cè),還可以解釋納米材料的毒性作用機(jī)制、識(shí)別屬性與毒性效應(yīng)的因果關(guān)系。目前納米銀毒性的機(jī)器學(xué)習(xí)模型考慮環(huán)境因素對(duì)毒性的影響,然而,水環(huán)境中多種因素可以改變?cè)夹螒B(tài)納米銀的物理化學(xué)性質(zhì),影響其環(huán)境轉(zhuǎn)化過程,進(jìn)而改變納米銀對(duì)藻類的毒性作用。因此,有必要在考慮環(huán)境因素的基礎(chǔ)上,建立納米銀藻類毒性的預(yù)測(cè)模型。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)和不足,提供一種基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,預(yù)測(cè)納米銀的藻類生長(zhǎng)抑制水平的半數(shù)效應(yīng)濃度(ec50)數(shù)據(jù),可以針對(duì)納米銀實(shí)現(xiàn)更加高效和快捷的生態(tài)風(fēng)險(xiǎn)評(píng)估。
2、為了實(shí)現(xiàn)上述目的,本專利技術(shù)所采用的技術(shù)方案如下:
3、一種基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,包括以下步驟:
4、s1.收集納米銀的物理性質(zhì)、化學(xué)性質(zhì)、實(shí)驗(yàn)方法和環(huán)境條件數(shù)據(jù),獲取包括納米銀的描述符和藻類生長(zhǎng)抑制數(shù)據(jù)的數(shù)據(jù)集;
5、s2.針對(duì)數(shù)據(jù)集存在的缺失值,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,并將數(shù)據(jù)集劃分為訓(xùn)練集和驗(yàn)證集;
6、s3.構(gòu)建納米銀藻類生長(zhǎng)抑制隨機(jī)森林預(yù)測(cè)模型,利用訓(xùn)練集數(shù)據(jù)對(duì)隨機(jī)森林預(yù)測(cè)模型進(jìn)行訓(xùn)練,直至隨機(jī)森林預(yù)測(cè)模型擬合穩(wěn)定;
7、s4.將驗(yàn)證集數(shù)據(jù)輸入訓(xùn)練好的隨機(jī)森林預(yù)測(cè)模型,隨機(jī)森林預(yù)測(cè)模型輸出納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)值,用于評(píng)估納米銀生態(tài)風(fēng)險(xiǎn)。
8、進(jìn)一步地,納米銀的描述符包括:來源、形狀、表面包覆、直徑、尺寸測(cè)試方法、水合尺寸、溶解度、zeta電位、聚合物分散性指數(shù)、ph、溫度、光照、暴露時(shí)長(zhǎng)、暴露實(shí)驗(yàn)、藻類生長(zhǎng)狀態(tài)。
9、進(jìn)一步地,針對(duì)數(shù)據(jù)集存在的缺失值,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,具體包括:
10、對(duì)于數(shù)值型數(shù)據(jù),使用平均值取代對(duì)應(yīng)描述符的缺失值;
11、對(duì)于文字描述型數(shù)據(jù),采用獨(dú)熱編碼將文字描述型數(shù)據(jù)轉(zhuǎn)變?yōu)槎诸惖臄?shù)值型數(shù)據(jù),即轉(zhuǎn)換成0和1,如果存在缺失值,采用數(shù)字2填充。
12、進(jìn)一步地,直徑、水合尺寸、溶解度、zeta電位、聚合物分散性指數(shù)、ph、溫度、光照、暴露時(shí)長(zhǎng)為數(shù)值型數(shù)據(jù)。
13、進(jìn)一步地,來源、形狀、表面包覆、尺寸測(cè)試方法、暴露實(shí)驗(yàn)、藻類生長(zhǎng)狀態(tài)為文字描述型數(shù)據(jù)。
14、進(jìn)一步地,使用隨機(jī)森林算法,構(gòu)建隨機(jī)森林預(yù)測(cè)模型,包括:
15、通過從訓(xùn)練集數(shù)據(jù)中有放回抽樣,生成多個(gè)子樣本集,即隨機(jī)子集;
16、對(duì)每個(gè)子樣本集構(gòu)建一棵決策樹,每棵決策樹的構(gòu)建過程為:
17、首先進(jìn)行特征選擇,即在每個(gè)節(jié)點(diǎn)分裂時(shí),隨機(jī)選擇一部分特征用于分裂,隨后根據(jù)所選特征中最優(yōu)的分裂點(diǎn),將節(jié)點(diǎn)分裂成子節(jié)點(diǎn),重復(fù)上述過程,直到達(dá)到預(yù)定停止條件;
18、最后基于平均值的方式,平均每棵決策樹的結(jié)果,獲得最終預(yù)測(cè)值。
19、進(jìn)一步地,使用python的scikit-learn包對(duì)隨機(jī)森林預(yù)測(cè)模型進(jìn)行建模,數(shù)據(jù)集包括52條數(shù)據(jù)記錄,將數(shù)據(jù)集按照4:1的比例劃分為訓(xùn)練集和驗(yàn)證集。
20、進(jìn)一步地,隨機(jī)森林算法采用scikit-learn包中的randomforestregressor函數(shù),具體參數(shù)為:決策樹數(shù)量設(shè)置為500棵,隨機(jī)數(shù)種子設(shè)置為2023,劃分標(biāo)準(zhǔn)采用均方誤差,其余參數(shù)為函數(shù)默認(rèn)值。
21、一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器中并可在處理器上運(yùn)行的計(jì)算機(jī)程序,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述任一項(xiàng)所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法的步驟。
22、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一項(xiàng)所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法的步驟。
23、與現(xiàn)有技術(shù)相比,本專利技術(shù)具有如下優(yōu)點(diǎn)和有益效果:
24、1.本專利技術(shù)涉及到的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,可以通過納米銀的物理性質(zhì)、化學(xué)性質(zhì)、擬實(shí)驗(yàn)方法和環(huán)境條件數(shù)據(jù),快速預(yù)測(cè)納米銀的藻類生長(zhǎng)抑制水平,方法不僅簡(jiǎn)單快捷、成本低廉,而且節(jié)省了實(shí)驗(yàn)測(cè)定所需的人力、物力和財(cái)力。
25、2.本專利技術(shù)納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法的建立和驗(yàn)證,嚴(yán)格依據(jù)oecd規(guī)定的qsar模型建立和使用導(dǎo)則,因此,使用本專利技術(shù)納米銀藻類生長(zhǎng)抑制水平的預(yù)測(cè)結(jié)果,可以為化學(xué)品監(jiān)管提供數(shù)據(jù)支持,對(duì)化學(xué)品的生態(tài)風(fēng)險(xiǎn)性評(píng)估具有重要意義。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,納米銀的描述符包括:來源、形狀、表面包覆、直徑、尺寸測(cè)試方法、水合尺寸、溶解度、Zeta電位、聚合物分散性指數(shù)、pH、溫度、光照、暴露時(shí)長(zhǎng)、暴露實(shí)驗(yàn)、藻類生長(zhǎng)狀態(tài)。
3.根據(jù)權(quán)利要求2所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,針對(duì)數(shù)據(jù)集存在的缺失值,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,具體包括:
4.根據(jù)權(quán)利要求3所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,直徑、水合尺寸、溶解度、Zeta電位、聚合物分散性指數(shù)、pH、溫度、光照、暴露時(shí)長(zhǎng)為數(shù)值型數(shù)據(jù)。
5.根據(jù)權(quán)利要求3所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,來源、形狀、表面包覆、尺寸測(cè)試方法、暴露實(shí)驗(yàn)、藻類生長(zhǎng)狀態(tài)為文字描述型數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,使用隨機(jī)森林算法,構(gòu)建隨機(jī)森林預(yù)測(cè)模型,包括:
7.根據(jù)權(quán)利要求6所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,使用Python的Scikit-learn包對(duì)隨機(jī)森林預(yù)測(cè)模型進(jìn)行建模,數(shù)據(jù)集包括52條數(shù)據(jù)記錄,將數(shù)據(jù)集按照4:1的比例劃分為訓(xùn)練集和驗(yàn)證集。
8.根據(jù)權(quán)利要求7所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,隨機(jī)森林算法采用Scikit-learn包中的RandomForestRegressor函數(shù),具體參數(shù)為:決策樹數(shù)量設(shè)置為500棵,隨機(jī)數(shù)種子設(shè)置為2023,劃分標(biāo)準(zhǔn)采用均方誤差,其余參數(shù)為函數(shù)默認(rèn)值。
9.一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器中并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至8任一項(xiàng)所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至8任一項(xiàng)所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法的步驟。
...【技術(shù)特征摘要】
1.一種基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,納米銀的描述符包括:來源、形狀、表面包覆、直徑、尺寸測(cè)試方法、水合尺寸、溶解度、zeta電位、聚合物分散性指數(shù)、ph、溫度、光照、暴露時(shí)長(zhǎng)、暴露實(shí)驗(yàn)、藻類生長(zhǎng)狀態(tài)。
3.根據(jù)權(quán)利要求2所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,針對(duì)數(shù)據(jù)集存在的缺失值,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,具體包括:
4.根據(jù)權(quán)利要求3所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,直徑、水合尺寸、溶解度、zeta電位、聚合物分散性指數(shù)、ph、溫度、光照、暴露時(shí)長(zhǎng)為數(shù)值型數(shù)據(jù)。
5.根據(jù)權(quán)利要求3所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,來源、形狀、表面包覆、尺寸測(cè)試方法、暴露實(shí)驗(yàn)、藻類生長(zhǎng)狀態(tài)為文字描述型數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的基于隨機(jī)森林的納米銀藻類生長(zhǎng)抑制水平預(yù)測(cè)方法,其特征在于,使用隨機(jī)森林算法,構(gòu)建隨機(jī)森...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:唐偉豪,趙青,吳豐昌,
申請(qǐng)(專利權(quán))人:廣東省科學(xué)院生態(tài)環(huán)境與土壤研究所,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。