System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于計算機生物學領域,尤其涉及一種基于圖transformer的蛋白質-配體對接打分模型的構建方法及其系統。
技術介紹
1、打分函數作為分子對接中的關鍵步驟,在用于新藥發現的虛擬篩選中至關重要。打分函數的主要目標是量化配體與受體間的相互作用能量,包括靜電相互作用、范德華力和氫鍵等因素。傳統的打分函數主要是基于力場的打分函數,這種方法基于物理化學原理,如分子力學模型,通過計算分子之間的相互作用能來預測配體與受體的結合親和力。基于力場的打分函數雖然精確,但在效率、靈活性以及對復雜相互作用和溶劑效應的建模上存在不足,且缺乏利用已有生物大分子數據的能力,導致其適應性和預測性能的不足。
2、為了解決前述問題,研究人員嘗試結合數據驅動的方法優化蛋白質-配體對接打分函數。隨著高通量篩選技術、結構生物學方法的進步,相關的蛋白質-配體復合物數據庫得以大規模建立和完善。這些數據庫的豐富為基于經驗和基于知識的打分函數提供了大量高質量的訓練和驗證數據,顯著提升了分子對接預測的準確性和可靠性。例如,vitscore借鑒于視覺領域的visiontransformer,利用3維網格體素化相互作用區域,利用3維卷積神經網絡學習特征,最后結合距離對構象進行打分。但是,該方法的體素化表示方法可能丟失蛋白質-配體對接構象的局部細節,而且,目前所公開的方法在對蛋白質特征進行學習時,使用全部特征進行學習,而蛋白質和配體在對接過程中實際只集中于部分點位而非全部的點位。總的來說,目前的方法只能提升部分能力,如vitscore僅提升了打分函數的對接能力,
技術實現思路
1、本專利技術的目的是針對現有技術存在的問題提出一種基于圖transformer的蛋白質-配體對接打分模型的構建方法及其系統。
2、為達到上述目的,本專利技術采用了下列技術方案:
3、一種基于圖transformer的蛋白質-配體對接打分模型的構建方法,模型包括依次相連的圖神經網絡、基于注意力機制的多層網絡以及解碼模塊;
4、解碼模塊包括mnd解碼模塊和pkd解碼模塊;
5、mnd解碼模塊用于計算蛋白質和配體之間距離概率分布;
6、pkd解碼模塊用于預測蛋白質和配體結合時的親和力值;
7、模型的損失函數包括mdn損失和pkd損失:,α和β分別是?mdn?損失和?pkd?損失的權重;
8、多層網絡的第一層具有隨著訓練迭代更新的用于指示特征被保留或屏蔽的掩碼向量;
9、所述模型以蛋白質圖和配體圖為輸入,由所述圖神經網絡將輸入轉換為嵌入向量;
10、所述的嵌入向量被輸入至所述的多層網絡進行掩碼處理后進入注意力機制計算得到蛋白質和配體圖的節點特征表示;
11、解碼模塊基于所述的節點特征進行對接打分預測;
12、模型基于所述的損失函數更新模型參數。
13、在上述的基于圖transformer的蛋白質-配體對接打分模型的構建方法中,將蛋白質和配體的三維空間關系表示為二維圖結構分別得到所述的蛋白質圖和配體圖;
14、所述的蛋白質圖包括蛋白質節點特征和蛋白質邊特征,配體圖包括配體節點特征和配體邊特征。
15、在上述的基于圖transformer的蛋白質-配體對接打分模型的構建方法中,所述的配體節點特征包括原子類型、雜化狀態、形式電荷、芳香性以及自由基電子的存在;
16、所述的配體邊特征由配體原子間鍵的屬性定義,包括鍵類型、共軛性和環參與。
17、在上述的基于圖transformer的蛋白質-配體對接打分模型的構建方法中,所述的蛋白質節點特征包括殘基類型、殘基內關鍵原子之間的空間距離、鍵內旋轉的二面角描述;
18、所述的蛋白質邊特征包括兩殘基是否連接,兩個殘基內部分原子的距離。
19、在上述的基于圖transformer的蛋白質-配體對接打分模型的構建方法中,圖神經網絡通過如下方式將輸入轉換為嵌入向量:
20、???(1)
21、????(2)
22、其中和分別表示輸入的節點和邊特征,i,j是索引變量,分別表示同一圖中的不同節點;
23、表示節點的初始特征,表示連接節點i,j邊特征;
24、和是對應的權重矩陣,和是節點和邊的偏置項。
25、在上述的基于圖transformer的蛋白質-配體對接打分模型的構建方法中,對于輸入的嵌入向量,經過掩碼處理后的特征表示為:
26、(3)
27、其中,m是掩碼向量,用于指示特征的保留或屏蔽,通過逐元素相乘操作,掩碼后的特征僅保留與掩碼向量中值為?1?的特征對應的部分。
28、在上述的基于圖transformer的蛋白質-配體對接打分模型的構建方法中,注意力機制通過如下方式計算得到蛋白質和配體圖的節點特征表示:
29、(11)
30、表示第l+1層中節點i的特征表示; relu表示非線性激活函數; norm表示歸一化操作;、是兩個權重矩陣;
31、表示節點i在第l+1層更新后的特征表示,通過如下方式得到:
32、(9)
33、i,j是索引變量,節點i和節點j分別表示同一圖中的不同節點;
34、為第l層中節點i的特征表示;表示線性變換矩陣;∥表示連接,k=1…k表示注意力頭數;
35、為注意力權重,與節點i的查詢向量、節點j的鍵向量和節點ij之間的邊特征向量相關;
36、為特征節點j的值向量。
37、在上述的基于圖transformer的蛋白質-配體對接打分模型的構建方法中,mdn損失和pkd?損失分別為:
38、(17)
39、(21)
40、n表示樣本總數;表示第n個樣本中,蛋白質節點i和配體節點j之間關系的權重;
41、表示給定蛋白質節點 i和配體節點 j的特征和時,蛋白質節點 i和配體節點 j之間距離 d( i, j)的條件概率分布;
42、表示第 n個樣本中,蛋白質節點i和配體節點j之間關系的高斯分布的標準差;
43、表示第 i個樣本的預測 pkd值;表示第 i個樣本的真實 pkd值。
44、本文檔來自技高網...
【技術保護點】
1.一種基于圖Transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,模型包括依次相連的圖神經網絡、基于注意力機制的多層網絡以及解碼模塊;
2.根據權利要求1所述的基于圖Transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,將蛋白質和配體的三維空間關系表示為二維圖結構分別得到所述的蛋白質圖和配體圖;
3.根據權利要求2所述的基于圖Transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,所述的配體節點特征包括原子類型、雜化狀態、形式電荷、芳香性以及自由基電子的存在;
4.根據權利要求2所述的基于圖Transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,所述的蛋白質節點特征包括殘基類型、殘基內關鍵原子之間的空間距離、鍵內旋轉的二面角描述;
5.根據權利要求1所述的基于圖Transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,圖神經網絡通過如下方式將輸入轉換為嵌入向量:
6.根據權利要求5所述的基于圖Transformer的蛋白質-配體對接打分模
7.根據權利要求1所述的基于圖Transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,注意力機制通過如下方式計算得到蛋白質和配體圖的節點特征表示:
8.根據權利要求5所述的基于圖Transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,MDN損失和pKd?損失分別為:
9.根據權利要求1-8任意一項所述的基于圖Transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,訓練模型所使用的訓練數據包括所述的蛋白質圖和配體圖,以及相應的標簽數據;
10.一種蛋白質-配體對接打分系統,其特征在于,包括通過權利要求1-9任意一項所述方法構建的打分模型;
...【技術特征摘要】
1.一種基于圖transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,模型包括依次相連的圖神經網絡、基于注意力機制的多層網絡以及解碼模塊;
2.根據權利要求1所述的基于圖transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,將蛋白質和配體的三維空間關系表示為二維圖結構分別得到所述的蛋白質圖和配體圖;
3.根據權利要求2所述的基于圖transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,所述的配體節點特征包括原子類型、雜化狀態、形式電荷、芳香性以及自由基電子的存在;
4.根據權利要求2所述的基于圖transformer的蛋白質-配體對接打分模型的構建方法,其特征在于,所述的蛋白質節點特征包括殘基類型、殘基內關鍵原子之間的空間距離、鍵內旋轉的二面角描述;
5.根據權利要求1所述的基于圖transformer的蛋白質-配體對接打分模型的構建方法,其特征...
【專利技術屬性】
技術研發人員:劉利,鄒權,張潤華,丁漪杰,吳宏杰,
申請(專利權)人:電子科技大學長三角研究院衢州,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。