System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及生物醫學和圖像處理的,尤其涉及一種基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,主要用于蛋白質表示、藥物篩選、發現和設計。
技術介紹
1、藥物與靶標親和力預測應用領域包括藥物發現和開發和疾病治療中。在實際應用中,通常使用神經網絡來預測藥物與靶標之間的親和力。常見的基于深度學習的方法,例如,卷積神經網絡,在藥物與靶標親和力預測中廣泛應用。這些模型通常將三維化合物轉換為一維序列,以提取結合親和力的基本特征信息。然而,一維序列缺乏足夠的結構信息,限制了預測準確性。
2、最近的一些方法使用圖的結構來表示化合物和蛋白質。在化合物中,藥物原子被視為節點,而化學鍵則是邊。在蛋白質中,殘基被視為節點,而接觸圖定義拓撲結構,這是一種具有殘基之間距離的矩陣。與一維序列輸入相比,基于圖的模型可以從藥物和蛋白質中捕獲更多信息,包括原子類型、原子間的鍵以及拓撲結構,從而提高藥物與靶標親和力預測準確性。這些方法包括將化合物表示為圖結構,使用原子作為節點,化學鍵作為邊;將蛋白質表示為圖結構,使用殘基作為節點,接觸圖定義拓撲結構。這些方法可以捕獲更多的結構信息,從而提高藥物與靶標親和力預測準確性。
3、圖的結構可以保留更多的結構信息,并增加藥物和蛋白質特征的多樣性,從而促進了各種基于圖神經網絡方法的發展來捕獲這些特征。例如,最近的研究通過自注意力和圖神經網絡的池化機制,以及各種池化策略增強了圖神經網絡的特征表示。還有通過注意力機制融合藥物和殘基表示。或者有的方法考慮水分子對藥物與靶標親和力預測的影響,使用配體非結合和
4、然而,這些方法盡管取得了進展,但仍然無法充分代表蛋白質的物理化學特性,特別是蛋白質口袋結構。在改變圖的結構后,它們也缺乏適當的信息傳遞方式。因此,準確地表示靠近藥物與標靶結合口袋的拓撲結構對于改善dta(drug?target?affinity,藥物與靶標親和力)預測至關重要。
技術實現思路
1、為克服現有技術的缺陷,本專利技術要解決的技術問題是提供了一種基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其能夠更好地描述蛋白質的物理化學性質,特別是口袋區域的結構和動力學,能夠更好地捕捉dta預測中的關鍵模式和特征,從而提高預測的準確性。
2、本專利技術的技術方案是:這種基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,包括以下步驟:
3、(1)將藥物和靶標表示為圖的結構,使用蛋白質的氨基酸序列和接觸圖來構建蛋白質圖,藥物的分子圖基于簡化分子線性輸入規范字符串;
4、(2)提取藥物和靶標的表示,將蛋白質口袋信息整合為拓撲結構,并創建虛擬節點將其納入殘基圖中,在獲得增強的殘基圖和分子圖之后,使用不同的圖神經網絡模塊來提取表示;
5、(3)將這些表示連接起來并輸入到多層感知機中,以預測親和力。
6、通過將額外的拓撲信息整合到原始圖形中,為節點和圖中的邊之間的關系提供了更多的背景信息,使得模型能夠更好地捕捉圖形結構中的模式和特征。此外,還將蛋白質口袋信息(作為拓撲信息)整合到了蛋白質殘基圖形結構中,使用了一種新的蛋白質表示方法和虛擬節點來提取蛋白質拓撲信息。這種方法能夠更好地描述蛋白質的物理化學性質,特別是口袋區域的結構和動力學。通過這種方法,能夠更好地捕捉dta預測中的關鍵模式和特征,從而提高預測的準確性。
本文檔來自技高網...【技術保護點】
1.基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:該方法包括以下步驟:
2.根據權利要求1所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(1)中,對于藥物,將藥物的簡化分子線性輸入規范字符串轉換成分子圖,其中原子是節點,原子之間的化學鍵是邊;考慮到原子的自我作用在消息傳遞過程中,為每個原子添加自環,在分子圖中的節點特征由五個屬性組成:原子符號、原子度、與原子綁定的氫原子數量、與原子隱式綁定的氫原子數量、原子是否芳香族,這些屬性被組合成一個多維特征向量,將分子圖表示為:
3.根據權利要求2所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(1)中,為了增強殘基圖的表達,從蛋白質口袋數據庫中獲取每個蛋白質的口袋信息,并將這些信息集成到殘基圖中,每個蛋白質的口袋信息定義為{ptk|k∈l},其中l表示蛋白質口袋的數量,表示第k個口袋中的氨基酸位置,為了促進與這些口袋相關的節點之間的通信,在殘基圖中為每個口袋創建一個虛擬節點,對于每個蛋白質的殘基圖,為虛擬節點創建一個額外的特征矩陣Vvn
4.根據權利要求3所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(1)中,為了增強蛋白質表示,每個蛋白質口袋都被表示為一個虛擬節點,這個虛擬節點與所有臨近的殘基節點相連,以捕捉口袋區域內的局部相互作用。
5.根據權利要求3所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(1)中,信息從殘基節點傳遞到虛擬節點,原始的殘基圖表示為:
6.根據權利要求5所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(2)中,為了獲得藥物表示,使用圖卷積網絡從口袋圖和分子圖中提取特征,對于一個圖G=(V,A),其中V表示特征矩陣,A是圖的鄰接矩陣,圖卷積網絡的消息傳遞過程由以下公式確定:
7.根據權利要求6所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(2)中,為了提取圖表示,所有節點特征都通過一個池化層,將它們壓縮成統一的圖表示,使用三個GCN層來提取藥物表示:
8.根據權利要求7所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(2)中,為了提取蛋白質表示,構建一個多拓撲圖神經網絡塊,這個塊在其各層之間使用不同的消息傳遞策略;為了防止過度平滑化,在第三層應用G′pt的拓撲結構,其中從殘基節點到虛擬節點傳遞消息;在蛋白質口袋附近的消息傳遞,使用單向連接進行消息傳遞;口袋圖Gpt和G′pt被輸入到多拓撲圖神經網絡塊中,通過全局平均池化得到最終的蛋白質表示;將獲得的藥物和蛋白質表示連接起來,并通過多層感知機預測最終的親和力值:
...【技術特征摘要】
1.基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:該方法包括以下步驟:
2.根據權利要求1所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(1)中,對于藥物,將藥物的簡化分子線性輸入規范字符串轉換成分子圖,其中原子是節點,原子之間的化學鍵是邊;考慮到原子的自我作用在消息傳遞過程中,為每個原子添加自環,在分子圖中的節點特征由五個屬性組成:原子符號、原子度、與原子綁定的氫原子數量、與原子隱式綁定的氫原子數量、原子是否芳香族,這些屬性被組合成一個多維特征向量,將分子圖表示為:
3.根據權利要求2所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(1)中,為了增強殘基圖的表達,從蛋白質口袋數據庫中獲取每個蛋白質的口袋信息,并將這些信息集成到殘基圖中,每個蛋白質的口袋信息定義為{ptk|k∈l},其中l表示蛋白質口袋的數量,表示第k個口袋中的氨基酸位置,為了促進與這些口袋相關的節點之間的通信,在殘基圖中為每個口袋創建一個虛擬節點,對于每個蛋白質的殘基圖,為虛擬節點創建一個額外的特征矩陣vvn={vm+1,…,vm+l},其中l表示蛋白質口袋的數量,m表示節點數,這些虛擬節點向量初始化為零。
4.根據權利要求3所述的基于圖神經網絡拓撲增強的藥物與靶標親和力的預測方法,其特征在于:所述步驟(1)中,為了增強蛋白質表示,每個蛋白質口袋都被表示為一個虛擬...
【專利技術屬性】
技術研發人員:郭恒亮,張叢祥,吳剛,張杜鵑,郭陽,商建東,畢躍峰,
申請(專利權)人:鄭州大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。