System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本說明書涉及計算機,尤其涉及一種信息生成模型訓練方法和信息生成方法。
技術介紹
1、隨著材料科學和計算技術的快速發(fā)展,材料結(jié)構(gòu)胞元(即材料的基本結(jié)構(gòu)單元)的生成在材料設計、性能優(yōu)化等領域具有重要意義。傳統(tǒng)的材料設計方法往往依賴于大量的實驗和經(jīng)驗,周期長、成本高,隨著近年來人工智能技術的發(fā)展,大模型的應用為材料設計提供了新的思路。
2、然而,現(xiàn)有應用于材料領域的模型往往需要通過大量的數(shù)據(jù)資源進行全量訓練,但是材料科學領域的數(shù)據(jù)相對有限,基于有限的數(shù)據(jù)難以使模型達到理想的性能。
3、因此,如何在有限的樣本數(shù)據(jù)下保證模型的推理性能,是一個亟待解決的問題。
技術實現(xiàn)思路
1、本說明書提供一種信息生成模型訓練方法和信息生成方法,以部分的解決現(xiàn)有技術存在的上述問題。
2、本說明書采用下述技術方案:
3、本說明書提供了一種信息生成模型訓練方法,包括:
4、獲取針對基礎生成模型的樣本數(shù)據(jù),并基于所述樣本數(shù)據(jù)構(gòu)建訓練指令,所述樣本數(shù)據(jù)中包含有不同屬性信息的材料結(jié)構(gòu)數(shù)據(jù),所述訓練指令用于引導所述基礎生成模型生成具有指定屬性的材料結(jié)構(gòu)數(shù)據(jù),或引導所述基礎生成模型生成指定材料結(jié)構(gòu)數(shù)據(jù)的屬性信息;
5、將所述訓練指令以及所述樣本數(shù)據(jù)輸入所述基礎生成模型,得到第一預測結(jié)果;
6、根據(jù)所述第一預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽,確定測試結(jié)果,并根據(jù)所述測試結(jié)果對所述訓練指令進行調(diào)整,得到目標訓練指令,以及,對所述基礎生成模型的
7、將所述目標訓練指令以及所述樣本數(shù)據(jù)輸入所述信息生成模型,以通過所述信息生成模型,確定第二預測結(jié)果;
8、根據(jù)所述第二預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽,確定所述信息生成模型的損失值,并根據(jù)所述損失值對所述信息生成模型進行訓練。
9、可選地,根據(jù)所述測試結(jié)果對所述訓練指令進行調(diào)整,得到目標訓練指令,具體包括:
10、根據(jù)所述第一預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽之間的偏差,確定所述預測結(jié)果中不滿足預設條件的信息,作為調(diào)整參考信息;
11、根據(jù)所述調(diào)整參考信息,對所述訓練指令進行調(diào)整,得到所述目標訓練指令。
12、可選地,對所述基礎生成模型的模型參數(shù)進行壓縮處理,得到待訓練的信息生成模型,具體包括:
13、對所述基礎生成模型的權(quán)重矩陣進行低秩分解,并基于低秩分解后得到的權(quán)重矩陣對所述基礎生成模型進行調(diào)整,得到所述信息生成模型。
14、可選地,根據(jù)所述預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽,確定所述信息生成模型的損失值,并根據(jù)所述損失值對所述信息生成模型進行訓練,具體包括:
15、根據(jù)所述預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽,確定所述信息生成模型的損失值,并根據(jù)所述損失值對所述信息生成模型預訓練,得到經(jīng)過預訓練的信息生成模型;
16、對所述經(jīng)過預訓練的信息生成模型的目標訓練指令進行調(diào)整,并通過調(diào)整后的目標訓練指令對所述經(jīng)過預訓練的信息生成模型進行訓練。
17、可選地,在將所述目標訓練指令以及所述樣本數(shù)據(jù)輸入所述信息生成模型之前,所述方法還包括:
18、根據(jù)所述目標訓練指令的復雜程度,確定是否滿足預設的信息接入條件;
19、若是,則獲取預設的推理引導數(shù)據(jù),所述推理引導數(shù)據(jù)中包含有若干個推理步驟對應的步驟描述信息,用于對所述信息生成模型在確定所述預測結(jié)果的過程中所執(zhí)行的推理步驟進行引導;
20、將所述目標訓練指令以及所述樣本數(shù)據(jù)輸入所述信息生成模型,以通過所述信息生成模型,確定第二預測結(jié)果,具體包括:
21、將所述目標訓練指令、所述樣本數(shù)據(jù)以及所述推理引導數(shù)據(jù)輸入所述信息生成模型,以通過所述信息生成模型,在所述推理引導數(shù)據(jù)所包含的各步驟描述信息的引導下,執(zhí)行各推理步驟,得到所述預測結(jié)果。
22、可選地,在將所述目標訓練指令以及所述樣本數(shù)據(jù)輸入所述信息生成模型之前,所述方法還包括:
23、根據(jù)目標訓練指令的復雜程度,確定是否滿足預設的信息接入條件;
24、若是,則根據(jù)所述目標訓練指令,確定所述信息生成模型所生成的材料結(jié)構(gòu)數(shù)據(jù)對應的屬性信息,并在預設的知識庫中查詢與所述屬性信息相匹配的信息,作為描述增強信息;
25、將所述描述增強信息對所述目標訓練指令進行更新。
26、本說明書提供了一種信息生成方法,包括:
27、接收信息生成指令,其中,所述信息生成指令用于指示預先訓練的信息生成模型生成具有指定屬性信息的材料結(jié)構(gòu)數(shù)據(jù),或根據(jù)指定材料結(jié)構(gòu)數(shù)據(jù)生成屬性信息,所述信息生成模型是通過上述方法訓練得到的;
28、將所述生成指令輸入所述信息生成模型,以通過所述信息生成模型,生成材料信息。
29、本說明書提供了一種信息生成模型訓練裝置,包括:
30、接收模塊,用于獲取針對基礎生成模型的樣本數(shù)據(jù),并基于所述樣本數(shù)據(jù)構(gòu)建訓練指令,所述樣本數(shù)據(jù)中包含有不同屬性信息的材料結(jié)構(gòu)數(shù)據(jù),所述訓練指令用于引導所述基礎生成模型生成具有指定屬性的材料結(jié)構(gòu)數(shù)據(jù),或引導所述基礎生成模型生成指定材料結(jié)構(gòu)數(shù)據(jù)的屬性信息;
31、第一預測模塊,用于將所述訓練指令以及所述樣本數(shù)據(jù)輸入所述基礎生成模型,得到第一預測結(jié)果;
32、調(diào)整模塊,用于根據(jù)所述第一預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽,確定測試結(jié)果,并根據(jù)所述測試結(jié)果對所述訓練指令進行調(diào)整,得到目標訓練指令,以及,對所述基礎生成模型的模型參數(shù)進行壓縮處理,得到待訓練的信息生成模型;
33、第二預測模塊,用于將所述目標訓練指令以及所述樣本數(shù)據(jù)輸入所述信息生成模型,以通過所述信息生成模型,確定第二預測結(jié)果;
34、訓練模塊,用于根據(jù)所述第二預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽,確定所述信息生成模型的損失值,并根據(jù)所述損失值對所述信息生成模型進行訓練。
35、本說明書提供了一種計算機可讀存儲介質(zhì),所述存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述信息生成模型訓練方法和信息生成方法。
36、本說明書提供了一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)上述信息生成模型訓練方法和信息生成方法。
37、本說明書采用的上述至少一個技術方案能夠達到以下有益效果:
38、在本說明書提供的信息生成模型訓練方法中,獲取針對基礎生成模型的樣本數(shù)據(jù),并基于所述樣本數(shù)據(jù)構(gòu)建訓練指令,并將樣本數(shù)據(jù)以及訓練指令輸入基礎生成模型,得到測試結(jié)果,并根據(jù)測試結(jié)果對訓練指令進行調(diào)整,得到目標訓練指令,以及,對基礎生成模型的模型參數(shù)進行壓縮處理,得到待訓練的信息生成模型;將目標訓練指令以及樣本數(shù)據(jù)并輸入信息生成模型,確定預測結(jié)果;根據(jù)預測結(jié)果對信息生成模型進行訓練。
本文檔來自技高網(wǎng)...【技術保護點】
1.一種信息生成模型訓練方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,根據(jù)所述測試結(jié)果對所述訓練指令進行調(diào)整,得到目標訓練指令,具體包括:
3.如權(quán)利要求1所述的方法,其特征在于,對所述基礎生成模型的模型參數(shù)進行壓縮處理,得到待訓練的信息生成模型,具體包括:
4.如權(quán)利要求3所述的方法,其特征在于,根據(jù)所述預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽,確定所述信息生成模型的損失值,并根據(jù)所述損失值對所述信息生成模型進行訓練,具體包括:
5.如權(quán)利要求1所述的方法,其特征在于,在將所述目標訓練指令以及所述樣本數(shù)據(jù)輸入所述信息生成模型之前,所述方法還包括:
6.如權(quán)利要求1所述的方法,其特征在于,在將所述目標訓練指令以及所述樣本數(shù)據(jù)輸入所述信息生成模型之前,所述方法還包括:
7.一種信息生成方法,其特征在于,包括:
8.一種信息生成模型訓練裝置,其特征在于,包括:
9.一種計算機可讀存儲介質(zhì),其特征在于,所述存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述權(quán)利要求
10.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)上述權(quán)利要求1~7任一項所述的方法。
...【技術特征摘要】
1.一種信息生成模型訓練方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,根據(jù)所述測試結(jié)果對所述訓練指令進行調(diào)整,得到目標訓練指令,具體包括:
3.如權(quán)利要求1所述的方法,其特征在于,對所述基礎生成模型的模型參數(shù)進行壓縮處理,得到待訓練的信息生成模型,具體包括:
4.如權(quán)利要求3所述的方法,其特征在于,根據(jù)所述預測結(jié)果與所述樣本數(shù)據(jù)對應的實際標簽,確定所述信息生成模型的損失值,并根據(jù)所述損失值對所述信息生成模型進行訓練,具體包括:
5.如權(quán)利要求1所述的方法,其特征在于,在將所述目標訓練指令以及所述樣本數(shù)據(jù)輸入所述信息生成模型之...
【專利技術屬性】
技術研發(fā)人員:徐黎,李志寧,沈盼,馬雪,郭凱,聶元清,楊娟娟,
申請(專利權(quán))人:之江實驗室,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。