System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及反應產率預測,具體涉及一種基于圖注意力網絡的反應產率預測方法及裝置。
技術介紹
1、反應產率預測為化學和材料科學領域提供了重要支持,是一個備受關注的研究領域。反應產率預測旨在通過分析反應物的性質和反應條件等因素,預測化學反應的產率。在化學和材料的生產過程中,產率預測能夠大大縮短化學合成規劃的實驗過程,降低實驗成本。依賴于實驗數據和人工經驗的傳統方法需要很多人力成本,且效率低、泛化能力弱。計算化學和機器學習技術的成功應用使得數據驅動的產率預測方法成為主流,這些方法能夠從大量數據中學習到潛在的規律,實現了更準確的預測。近年來,隨著深度學習的發展,產率預測方法得到了顯著的進步,在藥物研發和新材料設計等領域起到了重要的作用。
2、目前,基于深度學習的方法通過計算電子描述符、幾何描述符等量子化學特征來描述反應物和反應條件的化學性質,利用隨機森林、mlp和cnn等機器學習和深度學習模型學習這些化學性質和產率之間的潛在關系。然而,目前的方法面臨兩個問題:忽略了不同原子的性質對化學反應的重要性以及反應物和產物之間的局部結構變化;難以捕捉同一反應不同反應條件下的產率變化。
3、因此,如何專利技術一種反應產率預測方法,能夠解決目前產率預測方法的缺點,提高產率預測的性能,成為亟需解決的問題。
技術實現思路
1、為此,本專利技術提供一種基于圖注意力網絡的反應產率預測方法及裝置,通過量子化學描述符提取計算化學特征,將其融入到圖的消息傳遞中實現同時學習計算化學特征和分子結
2、為了實現上述目的,本專利技術提供如下技術方案:一種基于圖注意力網絡的反應產率預測方法,包括:
3、從原始數據集中,提取設定信息數據,并對所述設定信息數據進行清洗處理,獲得清洗后的信息數據;將所述清洗后的信息數據生成訓練數據集;
4、基于圖注意力網絡和量子化學描述符,構建反應產率預測模型;
5、通過所述訓練數據集對所述反應產率預測模型進行訓練,獲得訓練好的反應產率預測模型;
6、將目標反應輸入所述訓練好的反應產率預測模型進行預測處理,獲得所述目標反應的反應產率。
7、作為一種基于圖注意力網絡的反應產率預測方法的優選方案,在從原始數據集中,提取所述設定信息數據的過程中,所述設定信息數據包括:反應物、產物、反應條件的smiles和產率信息。
8、作為一種基于圖注意力網絡的反應產率預測方法的優選方案,構建所述反應產率預測模型的步驟為:
9、對反應物、產物、反應條件進行計算,獲得反應物、產物和反應條件的量子化學描述符;所述量子化學描述符包括電子信息描述符和空間幾何描述符;
10、根據反應物及產物的所述量子化學描述符,通過卷積神經網絡學習反應物及產物的計算化學特征;
11、根據反應條件的所述量子化學描述符,通過全局注意力網絡學習反應條件的計算化學特征;
12、通過基于圖注意力網絡的反應表示學習策略,得到反應的表示;
13、通過由全連接網絡組成的預測層對所述反應的表示進行預測處理,得到產率的預測值。
14、作為一種基于圖注意力網絡的反應產率預測方法的優選方案,在根據反應物及產物的所述量子化學描述符,通過卷積神經網絡學習反應物及產物的計算化學特征的過程中,通過卷積神經網絡分別提取所述電子信息描述符和所述空間幾何描述符的計算化學特征,得到電子特征和幾何特征;將所述電子特征和所述幾何特征,拼接得到分子中每個原子的計算化學特征。
15、作為一種基于圖注意力網絡的反應產率預測方法的優選方案,在根據反應條件的所述量子化學描述符,通過全局注意力網絡學習反應條件的計算化學特征的過程中,對反應條件的分子,通過全局注意力網絡將反應條件分子中原子的計算化學特征進行融合,得到反應條件分子的計算化學特征向量;將所有反應條件分子的所述計算化學特征向量進行融合,作為反應條件的全局表示。
16、作為一種基于圖注意力網絡的反應產率預測方法的優選方案,在通過基于圖注意力網絡的反應表示學習策略,得到反應的表示的過程中,通過圖注意力網絡學習反應物的局部表示;通過多層全連接網絡將反應條件的所述計算化學特征進行特征變化,作為反應條件的全局表示;將所述反應物的局部表示和所述反應條件的全局表示進行融合更新,得到反應物端的表示;通過圖注意力網絡學習產物的局部表示,作為產物端的表示;將所述反應物端的表示和所述產物端的表示進行融合,得到反應的表示。
17、作為一種基于圖注意力網絡的反應產率預測方法的優選方案,所述反應產率預測模型的訓練步驟為:
18、將所述訓練數據集按照設定比例劃分為訓練集和測試集;
19、將所述訓練集按批次輸入所述反應產率預測模型,進行預測訓練;
20、將所述測試集輸入所述反應產率預測模型,計算所述反應產率預測模型的均方誤差損失;根據所述均方誤差損失對所述反應產率預測模型進行參數優化;
21、通過所述訓練集和所述測試集對所述反應產率預測模型進行迭代訓練,直至所述均方誤差損失停止下降或達到迭代次數,停止訓練,獲得所述訓練好的反應產率預測模型。
22、本專利技術還提供一種基于圖注意力網絡的反應產率預測裝置,基于以上一種基于圖注意力網絡的反應產率預測方法,包括:
23、訓練數據集生成模塊,用于從原始數據集中,提取設定信息數據,并對所述設定信息數據進行清洗處理,獲得清洗后的信息數據;將所述清洗后的信息數據生成訓練數據集;
24、反應產率預測模型構建模塊,用于基于圖注意力網絡和量子化學描述符,構建反應產率預測模型;
25、反應產率預測模型訓練模塊,用于通過所述訓練數據集對所述反應產率預測模型進行訓練,獲得訓練好的反應產率預測模型;
26、反應產率獲取模塊,用于將目標反應輸入所述訓練好的反應產率預測模型進行預測處理,獲得所述目標反應的反應產率。
27、作為一種基于圖注意力網絡的反應產率預測裝置的優選方案,所述訓練數據集生成模塊中,在從原始數據集中,提取所述設定信息數據的過程中,所述設定信息數據包括:反應物、產物、反應條件的smiles和產率信息。
28、作為一種基于圖注意力網絡的反應產率預測裝置的優選方案,所述反應產率預測模型構建模塊中,反應產率預測模型構建子模塊包括:
29、量子化學描述符獲取子模塊,用于對反應物、產物、反應條件進行計算,獲得反應物、產物和反應條件的量子化學描述符;所述量子化學描述符包括電子信息描述符和空間幾何描述符;
30、反應物及產物的計算化學特征學習子模塊,用于根據反應物及產物的所述量子化學描述符,通過卷積神經網絡學本文檔來自技高網...
【技術保護點】
1.一種基于圖注意力網絡的反應產率預測方法,其特征在于,包括:
2.根據權利要求1所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,在從原始數據集中,提取所述設定信息數據的過程中,所述設定信息數據包括:反應物、產物、反應條件的SMILES和產率信息。
3.根據權利要求2所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,構建所述反應產率預測模型的步驟為:
4.根據權利要求3所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,在根據反應物及產物的所述量子化學描述符,通過卷積神經網絡學習反應物及產物的計算化學特征的過程中,通過卷積神經網絡分別提取所述電子信息描述符和所述空間幾何描述符的計算化學特征,得到電子特征和幾何特征;將所述電子特征和所述幾何特征,拼接得到分子中每個原子的計算化學特征。
5.根據權利要求4所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,在根據反應條件的所述量子化學描述符,通過全局注意力網絡學習反應條件的計算化學特征的過程中,對反應條件的分子,通過全局注意力網絡將反應條件分子中原子的計算化
6.根據權利要求5所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,在通過基于圖注意力網絡的反應表示學習策略,得到反應的表示的過程中,通過圖注意力網絡學習反應物的局部表示;通過多層全連接網絡將反應條件的所述計算化學特征進行特征變化,作為反應條件的全局表示;將所述反應物的局部表示和所述反應條件的全局表示進行融合更新,得到反應物端的表示;通過圖注意力網絡學習產物的局部表示,作為產物端的表示;將所述反應物端的表示和所述產物端的表示進行融合,得到反應的表示。
7.根據權利要求6所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,所述反應產率預測模型的訓練步驟為:
8.一種基于圖注意力網絡的反應產率預測裝置,采用權利要求1-7任一項所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,包括:
9.根據權利要求8所述的一種基于圖注意力網絡的反應產率預測裝置,其特征在于,所述反應產率預測模型構建模塊中,反應產率預測模型構建子模塊包括:
10.根據權利要求9所述的一種基于圖注意力網絡的反應產率預測裝置,其特征在于,所述反應產率預測模型訓練模塊中,反應產率預測模型訓練子模塊包括:
...【技術特征摘要】
1.一種基于圖注意力網絡的反應產率預測方法,其特征在于,包括:
2.根據權利要求1所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,在從原始數據集中,提取所述設定信息數據的過程中,所述設定信息數據包括:反應物、產物、反應條件的smiles和產率信息。
3.根據權利要求2所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,構建所述反應產率預測模型的步驟為:
4.根據權利要求3所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,在根據反應物及產物的所述量子化學描述符,通過卷積神經網絡學習反應物及產物的計算化學特征的過程中,通過卷積神經網絡分別提取所述電子信息描述符和所述空間幾何描述符的計算化學特征,得到電子特征和幾何特征;將所述電子特征和所述幾何特征,拼接得到分子中每個原子的計算化學特征。
5.根據權利要求4所述的一種基于圖注意力網絡的反應產率預測方法,其特征在于,在根據反應條件的所述量子化學描述符,通過全局注意力網絡學習反應條件的計算化學特征的過程中,對反應條件的分子,通過全局注意力網絡將反應條件分子中原子的計算化學特征進行融合,得到反應條件分子的計算化學特征向量;將所有反應條件分子的所述計算化學特征向量進...
【專利技術屬性】
技術研發人員:李中偉,肖瑞,司如同,張翔宇,柳彥宏,
申請(專利權)人:煙臺國工智能科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。