System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據處理,特別涉及一種對材料分子進行可合成優化的處理方法和裝置。
技術介紹
1、材料分子設計在新材料發現和開發中占據重要地位,尤其在能源、催化劑和納米材料等領域。生成模型近年來已經成為材料分子設計的有效工具,但由于材料化學反應規則較為有限,由生成模型得到的材料分子往往存在可合成性較差的情況。
技術實現思路
1、本專利技術的目的,就是針對現有技術的缺陷,提供一種對材料分子進行可合成優化的處理方法、裝置、電子設備及計算機可讀存儲介質。本專利技術預先針對材料分子設置兩個信息庫:構建塊結構庫和反應規則庫,并對這兩個信息庫進行合并得到可合成化學信息庫;并結合可合成化學信息庫構建一個用于提高材料分子可合成性的處理模型記為可合成優化模型;并構建模型訓練數據集對可合成優化模型進行訓練;并在模型訓練結束后,基于可合成優化模型對用戶輸入的任意材料分子的分子圖進行可合成優化處理得到對應的優化后材料分子圖向當前用戶反饋。本專利技術提供的可合成優化模型能以滿足可合成性要求為前提對材料分子進行結構優化,在通過生成模型獲得一個材料分子之后通過本專利技術的可合成優化模型可以提高當前生成分子的可合成性。
2、為實現上述目的,本專利技術實施例第一方面提供了一種對材料分子進行可合成優化的處理方法,所述方法包括:
3、設置材料分子對應的構建塊結構庫和反應規則庫;并由所述構建塊結構庫和所述反應規則庫組成對應的可合成化學信息庫;并結合所述可合成化學信息庫構建一個用于提高材料分子可合成性的
4、構建模型訓練數據集記為對應的第一數據集;并基于所述第一數據集對所述可合成優化模型進行訓練;
5、模型訓練結束后,基于所述可合成優化模型對用戶輸入的任意材料分子的分子圖進行可合成優化處理得到對應的優化后材料分子圖向當前用戶反饋。
6、優選的,所述構建塊結構庫包括多個第一構建塊記錄;每個所述第一構建塊記錄與一個可合成的材料分子構建塊對應;所述第一構建塊記錄包括第一塊標識、第一塊結構和第一分子指紋;所述第一塊標識為當前構建塊的唯一標識;所述第一塊結構為當前構建塊的分子圖;所述第一分子指紋為當前構建塊的分子指紋;
7、所述反應規則庫包括多個第一反應規則記錄;每個所述第一反應規則記錄與一類材料分子的合成反應類型對應;所述第一反應規則記錄包括第一規則標識、第一反應規則類型、第一反應物序列和第二反應物序列;所述第一、第二反應物序列各自包含多個對應的第一、第二反應物標識;所述第一、第二反應物標識各為一個所述第一塊標識。
8、優選的,所述可合成優化模型用于對模型輸入的原始材料分子圖進行可合成優化處理并輸出對應的優化材料分子圖;
9、所述可合成優化模型的模型輸入端用于接收模型輸入的所述原始材料分子圖,模型輸出端用于輸出對應的所述優化材料分子圖;
10、所述可合成優化模型包括編碼器、解碼器、解碼輸出模塊、分子指紋預測模塊、構建塊處理模塊、反應規則預測模塊、反應規則處理模塊、可合成化學信息庫和分子圖堆棧;
11、所述編碼器的輸入端與所述模型輸入端連接,輸出端與所述解碼器的第一輸入端連接;所述解碼器的第二、第三輸入端分別與所述構建塊處理模塊的輸出端、所述反應規則處理模塊的輸出端連接,所述解碼器的第一、第二輸出端與所述解碼輸出模塊的第一、第二輸入端連接;所述解碼輸出模塊的第一、第二、第三輸出端分別與所述分子指紋預測模塊的輸入端、所述反應規則預測模塊的輸入端以及所述模型輸出端連接;所述分子指紋預測模塊的輸出端與所述構建塊處理模塊的輸入端連接;所述反應規則預測模塊的輸出端與所述反應規則處理模塊的輸入端連接;所述構建塊處理模塊和所述反應規則處理模塊還分別與所述可合成化學信息庫連接;所述解碼輸出模塊、所述構建塊處理模塊和所述反應規則處理模塊還分別與所述分子圖堆棧連接;
12、所述編碼器基于uni-mol模型實現;所述編碼器用于對所述原始材料分子圖進行原子級嵌入編碼處理得到對應的編碼張量x向所述解碼器發送;
13、所述解碼器基于transformer模型的decoder模型實現;所述解碼器由嵌入編碼模塊、n個解碼模塊、線性層和softmax層順次連接而成,預設的解碼層總數n為一個正整數;所述嵌入編碼模塊的第一、第二輸入端分別與所述解碼器的第二、第三輸入端連接;第一個所述解碼模塊的第一輸入端與所述嵌入編碼模塊的輸出端連接;除第一個所述解碼模塊之外,其余各個所述解碼模塊的第一輸入端均與前一個所述解碼模塊的輸出端連接;各個所述解碼模塊的第二輸入端均與所述解碼器的第一輸入端連接;最后一個所述解碼模塊的輸出端分別與所述線性層的輸入端、所述解碼器的第一輸出端連接;所述線性層的輸出端與所述softmax層的輸入端連接;所述softmax層的輸出端與所述解碼器的第二輸出端連接;
14、所述嵌入編碼模塊用于在第1步預測之前,基于預設的起始標記符設置對應的標記符類型s0;并在第i步預測時,基于預設的位置嵌入編碼規則設置對應的位置編碼向量pei,單步索引i為一個大于或等于1的整數;并對第i-1步對應的標記符類型si-1進行識別;若所述標記符類型si-1為起始標記符,則基于預設的起始類型嵌入編碼向量estart設置對應的標記符編碼向量ei;若所述標記符類型si-1為構建塊標記符,則使用一個預設的第一mlp網絡對所述標記符類型si-1對應的構建塊分子指紋pi-1進行嵌入編碼處理得到對應的所述標記符編碼向量ei;若所述標記符類型si-1為反應標記符,則基于預設的反應規則嵌入編碼規則對所述標記符類型si-1對應的反應規則類型ri-1進行嵌入編碼處理得到對應的所述標記符編碼向量ei;并由本次得到的所述位置編碼向量pei和所述標記符編碼向量ei組成第i步的起始解碼張量hi,0向第一個所述解碼模塊發送;
15、hi,0=pei+ei,
16、
17、其中,fmlp1()為所述第一mlp網絡對應的模型推理函數,θmlp1為所述第一mlp網絡的模型參數;embed()為所述反應規則嵌入編碼規則;
18、第一個所述解碼模塊用于根據所述編碼張量x和所述起始解碼張量hi,0進行解碼得到對應的解碼張量hi,1向第二個所述解碼模塊發送;第二個所述解碼模塊用于根據所述編碼張量x和所述解碼張量hi,1進行解碼得到對應的解碼張量hi,2向第三個所述解碼模塊發送;以此類推,直到第n個所述解碼模塊用于根據所述編碼張量x和解碼張量hi,n-1進行解碼得到對應的解碼張量hi,n向所述線性層以及所述解碼輸出模塊發送;
19、所述線性層用于對所述解碼張量hi,n進行全連接計算得到對應的全連接向量li向所述softmax層發送;
20、所述softmax層用于根據所述全連接向量li對第i步標記符類型進行預測得到對應的標記符類型si向所述解碼輸出模塊發送;所述標記符類型si包括構建塊標記符、反應標記符和結束標記符;
<本文檔來自技高網...【技術保護點】
1.一種對材料分子進行可合成優化的處理方法,其特征在于,所述方法包括:
2.根據權利要求1所述的對材料分子進行可合成優化的處理方法,其特征在于,
3.根據權利要求2所述的對材料分子進行可合成優化的處理方法,其特征在于,
4.根據權利要求3所述的對材料分子進行可合成優化的處理方法,其特征在于,
5.根據權利要求4所述的對材料分子進行可合成優化的處理方法,其特征在于,所述構建模型訓練數據集記為對應的第一數據集,具體包括:
6.根據權利要求4所述的對材料分子進行可合成優化的處理方法,其特征在于,所述基于所述第一數據集對所述可合成優化模型進行訓練,具體包括:
7.根據權利要求3所述的對材料分子進行可合成優化的處理方法,其特征在于,所述基于所述可合成優化模型對用戶輸入的任意材料分子的分子圖進行可合成優化處理得到對應的優化后材料分子圖向當前用戶反饋,具體包括:
8.一種用于執行權利要求1-7任一項所述的對材料分子進行可合成優化的處理方法的裝置,其特征在于,所述裝置包括:化學信息庫與模型構建模塊、模型訓練模塊和
9.一種電子設備,其特征在于,包括:存儲器、處理器和收發器;
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機指令,當所述計算機指令被計算機執行時,使得所述計算機執行權利要求1-7任一項所述的方法。
...【技術特征摘要】
1.一種對材料分子進行可合成優化的處理方法,其特征在于,所述方法包括:
2.根據權利要求1所述的對材料分子進行可合成優化的處理方法,其特征在于,
3.根據權利要求2所述的對材料分子進行可合成優化的處理方法,其特征在于,
4.根據權利要求3所述的對材料分子進行可合成優化的處理方法,其特征在于,
5.根據權利要求4所述的對材料分子進行可合成優化的處理方法,其特征在于,所述構建模型訓練數據集記為對應的第一數據集,具體包括:
6.根據權利要求4所述的對材料分子進行可合成優化的處理方法,其特征在于,所述基于所述第一數據集對所述可合成優化模型進行訓練,具體包括:
...
【專利技術屬性】
技術研發人員:趙國江,高志鋒,柯國霖,張林峰,
申請(專利權)人:北京深勢科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。