System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)涉及材料科學(xué)與機(jī)器學(xué)習(xí)交叉,更具體的說(shuō)是涉及一種數(shù)據(jù)保真度評(píng)價(jià)方法及系統(tǒng)。
技術(shù)介紹
1、目前,機(jī)器學(xué)習(xí)早已融入材料領(lǐng)域中,機(jī)器學(xué)習(xí)模型在預(yù)測(cè)材料屬性上取得不錯(cuò)進(jìn)展,更有專(zhuān)門(mén)為材料領(lǐng)域機(jī)器學(xué)習(xí)模型做基準(zhǔn)測(cè)試的matbench出現(xiàn),其展示并介紹了來(lái)自世界各地優(yōu)秀的材料屬性預(yù)測(cè)的機(jī)器學(xué)習(xí)模型,例如megnet、cgcnn等,對(duì)于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)模型來(lái)說(shuō),數(shù)據(jù)無(wú)疑是重要的,而材料領(lǐng)域中廣泛存在各種數(shù)量不同化學(xué)精度不同的數(shù)據(jù)集,即多保真度數(shù)據(jù),如何利用這些多保真度數(shù)據(jù)直接影響著模型最終的預(yù)測(cè)精度。
2、遺憾的是,即使多保真度數(shù)據(jù)在材料領(lǐng)域中廣泛存在,但材料屬性預(yù)測(cè)的機(jī)器學(xué)習(xí)模型在多保真度學(xué)習(xí)方法上的應(yīng)用卻較少,且對(duì)多保真度數(shù)據(jù)集的評(píng)價(jià)排序目前僅在經(jīng)驗(yàn)理論或者數(shù)據(jù)集本身的基礎(chǔ)上進(jìn)行,即通常將實(shí)驗(yàn)所得數(shù)據(jù)集作為最高保真度的數(shù)據(jù)集,而通過(guò)密度泛函理論(dft)計(jì)算的數(shù)據(jù)集作為低保真度,且對(duì)于不同dft數(shù)據(jù)集的保真度排序也是與實(shí)驗(yàn)數(shù)據(jù)集做對(duì)比得到(dft數(shù)據(jù)集與實(shí)驗(yàn)數(shù)據(jù)集分布越相似,則保真度越高)。這種排序方式可能存在一定問(wèn)題,即沒(méi)有定量分析,對(duì)于以上排序方法來(lái)說(shuō),在對(duì)比不同dft計(jì)算的數(shù)據(jù)集保真度時(shí)往往是利用了所能使用到的所有數(shù)據(jù)集,對(duì)于不同dft數(shù)據(jù)集來(lái)說(shuō)現(xiàn)存的數(shù)據(jù)量也是大有不同,其保真度排序的最終呈現(xiàn)往往與數(shù)據(jù)的“質(zhì)”和“量”有關(guān)。
3、不確定性量化(uncertainty?quantification,uq)早已被應(yīng)用于解決科學(xué)和工程中各種的現(xiàn)實(shí)問(wèn)題,所包含的領(lǐng)域例如有計(jì)算機(jī)視覺(jué),圖像處理,醫(yī)學(xué)圖像分
4、因此,如何根據(jù)預(yù)測(cè)結(jié)果的不確定性提供一種定量分析多保真度排序評(píng)價(jià)方法是本領(lǐng)域技術(shù)人員亟需解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,傳統(tǒng)材料領(lǐng)域?qū)傩灶A(yù)測(cè)的機(jī)器學(xué)習(xí)模型無(wú)法為預(yù)測(cè)值提供對(duì)應(yīng)的不確定性,考慮到不確定性對(duì)于材料屬性預(yù)測(cè)過(guò)程中的重要性,結(jié)合前人對(duì)于材料屬性預(yù)測(cè)中uq的研究基礎(chǔ),本專(zhuān)利技術(shù)針對(duì)材料領(lǐng)域機(jī)器學(xué)習(xí)模型,提供了兩種與之前不同且易于遷移擴(kuò)展的方式來(lái)得到不確定性,并在此基礎(chǔ)上對(duì)數(shù)據(jù)保真度做評(píng)價(jià),專(zhuān)利技術(shù)條目如下:
2、(1)通過(guò)修改預(yù)測(cè)模型的損失函數(shù)來(lái)直接預(yù)測(cè)不確定性。
3、(2)通過(guò)對(duì)預(yù)測(cè)模型提取描述子后使用gpr訓(xùn)練并預(yù)測(cè)不確定性。
4、(3)通過(guò)上述2種不確定性量化方法評(píng)價(jià)數(shù)據(jù)保真度。
5、為了實(shí)現(xiàn)上述目的,本專(zhuān)利技術(shù)采用如下技術(shù)方案:
6、一種數(shù)據(jù)保真度評(píng)價(jià)方法,包括以下步驟:
7、獲取多保真度數(shù)據(jù)集,采用多保真度數(shù)據(jù)集中數(shù)據(jù)量最小的數(shù)據(jù)集所包含的數(shù)據(jù)量;
8、構(gòu)建并改進(jìn)預(yù)測(cè)模型,并利用改進(jìn)后的預(yù)測(cè)模型對(duì)數(shù)據(jù)集進(jìn)行不確定性量化,得到預(yù)測(cè)結(jié)果;
9、對(duì)所述預(yù)測(cè)結(jié)果進(jìn)行排序及分析,完成數(shù)據(jù)保真度評(píng)價(jià)。
10、優(yōu)選的,得到預(yù)測(cè)結(jié)果的具體過(guò)程包括:
11、修改預(yù)測(cè)模型的輸出層維度為n,然后訓(xùn)練模型;
12、修改預(yù)測(cè)模型代碼中的損失函數(shù);
13、調(diào)用預(yù)測(cè)模型進(jìn)行預(yù)測(cè),輸出預(yù)測(cè)結(jié)果。
14、優(yōu)選的,在預(yù)測(cè)模型輸出層的最后添加激活函數(shù);保證預(yù)測(cè)的不確定性u(píng)是大于0的值。
15、優(yōu)選的,對(duì)所述預(yù)測(cè)結(jié)果進(jìn)行排序及分析,完成數(shù)據(jù)保真度評(píng)價(jià)的過(guò)程包括:
16、采用預(yù)測(cè)結(jié)果中包括的預(yù)測(cè)區(qū)間覆蓋率來(lái)評(píng)價(jià)數(shù)據(jù)的保真度,
17、當(dāng)預(yù)測(cè)區(qū)間覆蓋率小于等于0時(shí),則表示第i條數(shù)據(jù)對(duì)應(yīng)的真值包含于預(yù)測(cè)范圍區(qū)間內(nèi),保真度評(píng)價(jià)結(jié)果可靠;否則保真度評(píng)價(jià)結(jié)果不可靠;
18、完成預(yù)測(cè)區(qū)間覆蓋率的可靠性判斷后,對(duì)所述預(yù)測(cè)區(qū)間覆蓋率進(jìn)行排序,得到排序結(jié)果。
19、優(yōu)選的,得到不確定性量化結(jié)果的過(guò)程還包括:
20、通過(guò)對(duì)預(yù)測(cè)模型提取描述子后使用高斯回歸過(guò)程訓(xùn)練并預(yù)測(cè)不確定性,包括:
21、步驟1:構(gòu)建并訓(xùn)練預(yù)測(cè)模型;
22、步驟2:提取多保真度數(shù)據(jù)集,通過(guò)預(yù)測(cè)模型直接預(yù)測(cè)不確定性的預(yù)測(cè)區(qū)間覆蓋率對(duì)應(yīng)位置處的描述子來(lái)獲取所有數(shù)據(jù)對(duì)應(yīng)的預(yù)測(cè)模型的描述子;
23、步驟3:提取出來(lái)的描述子經(jīng)過(guò)高斯過(guò)程回歸gpr進(jìn)行訓(xùn)練;
24、步驟4:待預(yù)測(cè)的原始數(shù)據(jù)先經(jīng)過(guò)步驟1訓(xùn)練好的模型來(lái)獲取對(duì)應(yīng)的描述子,然后將獲取到的描述子輸入到步驟3訓(xùn)練好的高斯過(guò)程回歸模型中,由高斯過(guò)程回歸模型預(yù)測(cè)得到不確定性。
25、優(yōu)選的,數(shù)據(jù)保真度評(píng)價(jià)方法的系統(tǒng),包含以下模塊:
26、獲取模塊:用于獲取多保真度數(shù)據(jù)集,采用多保真度數(shù)據(jù)集中數(shù)據(jù)量最小的數(shù)據(jù)集所包含的數(shù)據(jù)量;
27、模型構(gòu)建模塊:用于構(gòu)建并改進(jìn)預(yù)測(cè)模型;
28、優(yōu)化模塊:利用改進(jìn)后的所述預(yù)測(cè)模型對(duì)數(shù)據(jù)集進(jìn)行不確定性量化,得到不確定性量化結(jié)果;
29、評(píng)價(jià)模塊:用于對(duì)所述不確定性量化結(jié)果進(jìn)行排序及分析,完成數(shù)據(jù)保真度評(píng)價(jià)。
30、經(jīng)由上述的技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本專(zhuān)利技術(shù)公開(kāi)提供了一種數(shù)據(jù)保真度評(píng)價(jià)方法及系統(tǒng),本專(zhuān)利技術(shù)是采用了接受度更廣、使用率更高的預(yù)測(cè)模型預(yù)測(cè)不確定性,僅通過(guò)修改預(yù)測(cè)模型本身的損失函數(shù)就能夠達(dá)到預(yù)測(cè)不確定性的效果,同時(shí),損失函數(shù)的修改是非常靈活且便捷的,使用者可以根據(jù)自身需求對(duì)其進(jìn)行改變,這也提高了該專(zhuān)利技術(shù)應(yīng)用的可能性及便利性。此外,針對(duì)通過(guò)提取描述子并與高斯過(guò)程結(jié)合預(yù)測(cè)不確定性的方式,本專(zhuān)利技術(shù)也提供了預(yù)測(cè)模型提取的描述子與高斯過(guò)程組合的情況,給出了所使用預(yù)測(cè)模型詳細(xì)的描述子提取位置,彌補(bǔ)了預(yù)測(cè)模型與高斯過(guò)程組合預(yù)測(cè)不確定性這一空缺。最后,結(jié)合以上材料領(lǐng)域的不確定性量化方法,本專(zhuān)利技術(shù)從不確定性量化評(píng)價(jià)數(shù)據(jù)保真度這一方面提供了一種與眾不同的多保真度數(shù)據(jù)評(píng)價(jià)方法。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,得到預(yù)測(cè)結(jié)果的具體過(guò)程包括:
3.根據(jù)權(quán)利要求2所述的一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,在預(yù)測(cè)模型輸出層的最后添加激活函數(shù);保證預(yù)測(cè)的不確定性u(píng)是大于0的值。
4.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,對(duì)所述預(yù)測(cè)結(jié)果進(jìn)行排序及分析,完成數(shù)據(jù)保真度評(píng)價(jià)的過(guò)程包括:
5.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,得到不確定性量化結(jié)果的過(guò)程還包括:
6.根據(jù)權(quán)利要求5所述的一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,通過(guò)對(duì)預(yù)測(cè)模型提取描述子后使用高斯回歸過(guò)程訓(xùn)練并預(yù)測(cè)不確定性,包括:
7.一種利用權(quán)利要求1-6任一項(xiàng)所述的數(shù)據(jù)保真度評(píng)價(jià)方法的系統(tǒng),其特征在于,包含以下模塊:
8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)存儲(chǔ)計(jì)算機(jī)指令,當(dāng)計(jì)算機(jī)讀取存儲(chǔ)介質(zhì)中的計(jì)算機(jī)指令后,計(jì)算機(jī)執(zhí)行如權(quán)利要求1-6中任意一項(xiàng)所述的數(shù)據(jù)保真度評(píng)價(jià)方法。
【技術(shù)特征摘要】
1.一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,得到預(yù)測(cè)結(jié)果的具體過(guò)程包括:
3.根據(jù)權(quán)利要求2所述的一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,在預(yù)測(cè)模型輸出層的最后添加激活函數(shù);保證預(yù)測(cè)的不確定性u(píng)是大于0的值。
4.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)保真度評(píng)價(jià)方法,其特征在于,對(duì)所述預(yù)測(cè)結(jié)果進(jìn)行排序及分析,完成數(shù)據(jù)保真度評(píng)價(jià)的過(guò)程包括:
5.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)保...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:劉曉彤,王滋明,楊濤,鄭丹妮,
申請(qǐng)(專(zhuān)利權(quán))人:北京信息科技大學(xué),
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。