System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及力場開發(fā),特別是涉及一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法。
技術(shù)介紹
1、分子動(dòng)力學(xué)模擬,作為一種揭示物質(zhì)微觀行為及其性質(zhì)的強(qiáng)大工具,在眾多科研領(lǐng)域已經(jīng)展現(xiàn)出巨大的潛力和顯著的成就。然而,這項(xiàng)技術(shù)的精確度一直受到力場模型的限制,傳統(tǒng)經(jīng)驗(yàn)勢的局限性往往制約了模擬結(jié)果的準(zhǔn)確性。隨著機(jī)器學(xué)習(xí)勢函數(shù)的興起,分子動(dòng)力學(xué)模擬領(lǐng)域迎來了革命性的變化。通過訓(xùn)練機(jī)器學(xué)習(xí)模型來預(yù)測原子間的相互作用,機(jī)器學(xué)習(xí)勢函數(shù)不僅打破了傳統(tǒng)經(jīng)驗(yàn)勢的精度瓶頸,而且實(shí)現(xiàn)了與從頭算分子動(dòng)力學(xué)相媲美的高精度,同時(shí)保持了分子動(dòng)力學(xué)在計(jì)算效率上的優(yōu)勢。這一突破極大地增強(qiáng)了分子動(dòng)力學(xué)模擬的實(shí)用價(jià)值,使研究人員能夠以前所未有的精度和速度探索分子與材料的動(dòng)態(tài)行為,從而加速了材料科學(xué)、生物化學(xué)、藥物設(shè)計(jì)等領(lǐng)域的發(fā)展。機(jī)器學(xué)習(xí)勢函數(shù)的訓(xùn)練核心在于構(gòu)建高質(zhì)量的訓(xùn)練集,關(guān)鍵在于如何用有限且具有代表性的構(gòu)型來精確捕捉并泛化到廣泛的物理構(gòu)型。
2、目前,許多訓(xùn)練集采樣方法由于忽略了現(xiàn)實(shí)物理情境中的細(xì)微差異,導(dǎo)致訓(xùn)練出的機(jī)器學(xué)習(xí)勢函數(shù)在實(shí)際應(yīng)用中效果不佳。此外,雖然增加訓(xùn)練集的規(guī)模旨在提高性能,但這種做法往往伴隨著高昂的成本和有限的效果。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的不足,本專利技術(shù)的目的是提供一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法,通過融合波爾茲曼能量分布理論與最遠(yuǎn)點(diǎn)抽樣技術(shù),解決傳統(tǒng)數(shù)據(jù)采樣技術(shù)效果較差的問題,實(shí)現(xiàn)對數(shù)據(jù)集中最具代表性的、信息量最為豐富的子集的自動(dòng)識別和提取。
2、為實(shí)現(xiàn)上述目的,本
3、一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法,包括:
4、構(gòu)建機(jī)器學(xué)習(xí)勢函數(shù);
5、利用所述機(jī)器學(xué)習(xí)勢函數(shù)進(jìn)行分子動(dòng)力學(xué)模擬,得到原始數(shù)據(jù)庫;
6、利用第一性原理軟件對所述原始數(shù)據(jù)庫進(jìn)行單點(diǎn)能計(jì)算,得到構(gòu)型數(shù)據(jù);
7、對所述構(gòu)型數(shù)據(jù)進(jìn)行目標(biāo)參數(shù)分析和數(shù)據(jù)剔除,得到預(yù)處理數(shù)據(jù);所述目標(biāo)參數(shù)分析包括:能量分析、力分析以及位力分布分析;
8、對所述預(yù)處理數(shù)據(jù)進(jìn)行原子平均能量計(jì)算,得到原子平均能量數(shù)據(jù);
9、利用玻爾茲曼能量分布對所述原子平均能量數(shù)據(jù)進(jìn)行概率分布計(jì)算,得到概率分布數(shù)據(jù);
10、根據(jù)所述概率分布數(shù)據(jù)確定整體構(gòu)型采樣數(shù)量;
11、對所述原子平均能量數(shù)據(jù)進(jìn)行區(qū)間劃分,得到若干個(gè)能量區(qū)間,并根據(jù)所述概率分布數(shù)據(jù)和整體構(gòu)型采樣數(shù)量對每個(gè)所述能量區(qū)間的所述原子平均能量數(shù)據(jù)進(jìn)行構(gòu)型計(jì)算,得到區(qū)間內(nèi)構(gòu)型采樣數(shù)量;
12、根據(jù)所述區(qū)間內(nèi)構(gòu)型采樣數(shù)量對不同所述能量區(qū)間內(nèi)的構(gòu)型進(jìn)行標(biāo)記,并利用最遠(yuǎn)點(diǎn)抽樣技術(shù)對不同所述能量區(qū)間內(nèi)構(gòu)型的笛卡爾距離描述符進(jìn)行計(jì)算,得到差異性數(shù)據(jù);
13、根據(jù)所述差異性數(shù)據(jù),利用最遠(yuǎn)點(diǎn)采樣方法,選擇每個(gè)所述能量區(qū)間內(nèi)所述笛卡爾距離描述符距離最大的構(gòu)型,得到訓(xùn)練集,并將每個(gè)所述能量區(qū)間內(nèi)除所述訓(xùn)練集外的構(gòu)型整合為測試集。
14、優(yōu)選地,所述概率分布數(shù)據(jù)的計(jì)算公式為:其中,其中,p(e)為所述概率分布數(shù)據(jù);e為所述原子平均能量數(shù)據(jù)平均粒子能量;k為玻爾茲曼常數(shù);t為溫度;z為配分函數(shù);ei為第i個(gè)所述能量區(qū)間的平均粒子能量。
15、優(yōu)選地,所述機(jī)器學(xué)習(xí)勢函數(shù)的構(gòu)建技術(shù)包括:從頭算分子動(dòng)力學(xué)、拉伸壓縮模擬以及密度泛函理論單點(diǎn)能計(jì)算方法。
16、本專利技術(shù)公開了以下技術(shù)效果:
17、本專利技術(shù)提供了一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法,通過融合波爾茲曼能量分布理論與最遠(yuǎn)點(diǎn)抽樣技術(shù),解決了傳統(tǒng)數(shù)據(jù)采樣技術(shù)效果較差的問題,實(shí)現(xiàn)了對數(shù)據(jù)集中最具代表性的、信息量最為豐富的子集的自動(dòng)識別和提取。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法,其特征在于,所述概率分布數(shù)據(jù)的計(jì)算公式為:其中,其中,P(E)為所述概率分布數(shù)據(jù);E為所述原子平均能量數(shù)據(jù)平均粒子能量;k為玻爾茲曼常數(shù);T為溫度;Z為配分函數(shù);Ei為第i個(gè)所述能量區(qū)間的平均粒子能量。
3.根據(jù)權(quán)利要求1所述的一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法,其特征在于,所述機(jī)器學(xué)習(xí)勢函數(shù)的構(gòu)建技術(shù)包括:從頭算分子動(dòng)力學(xué)、拉伸壓縮模擬以及密度泛函理論單點(diǎn)能計(jì)算方法。
【技術(shù)特征摘要】
1.一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種最優(yōu)化機(jī)器學(xué)習(xí)勢函數(shù)訓(xùn)練集的方法,其特征在于,所述概率分布數(shù)據(jù)的計(jì)算公式為:其中,其中,p(e)為所述概率分布數(shù)據(jù);e為所述原子平均能量數(shù)據(jù)平均粒子能量;k為玻...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:董海寬,劉宇奇,樊哲勇,
申請(專利權(quán))人:渤海大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。