System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于藥物,尤其是涉及一種基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法。
技術介紹
1、過去的幾十年來,生物醫學的投資一直呈現增長趨勢,但是美國食品藥品監督管理局(fda)批準的新型治療方法和藥物數量與成本并不成正比例,這無疑浪費了大量的人力和財力。藥物發現是生物醫學領域的重要任務之一,但是藥物發現是一個極其昂貴和漫長,并且伴隨著高風險的過程。研究表明,一種藥物平均要花費26億美元,歷經10年以上甚至的時間才能研發成功。已經獲批生產的藥物因為其耐受性和藥理學特性,可以被證明在臨床上更安全。藥物重定位(dr)方法,即從已知的獲批準的藥物中尋找新的疾病適應藥物,加速藥物發現和研發過程,降低成本和風險。藥物重定位方法與傳統藥物發現相比,可以有效地縮短時間多達6.5年,降低開發成本3億美元。例如,阿茲夫定是一種艾滋病毒逆轉錄酶抑制劑。在使用阿茲夫定對新型冠狀病毒(covid-19)感染患者的治療過程中,31名患者的平均治愈時間為3.29±2.22天。阿茲夫定對所有嚴重程度的患者均有顯著療效,且副作用輕微且短暫,優于已獲批準的新冠治療藥物瑞德西韋。這些成功的案例讓藥物重定位吸引了眾多藥物研發企業和學術研究領域的關注。
2、近年來,計算生物學方法發展為藥物重定位提供了新的途徑。計算生物學方法不僅可以利用大規模的生物分子數據和藥物的化學數據,還可以分析復雜的分子相互作用網絡,以識別藥物和疾病之間的潛在關聯。傳統的藥物-疾病關聯預測方法通常僅關注了單方面的信息,然而,藥物與疾病關聯關系十分復雜,涉及到藥物分子結構、
3、目前流行的藥物重定位方法主要包括基于文本挖掘,矩陣分解和補全和網絡的方法。文本挖掘方法通過從生物醫學文獻中提取藥物、基因等實體關系,來構建關聯知識庫預測新的藥物適應癥。bayes將藥物不良反應與疾病相匹配,將來自藥物標簽的不良反應信息與藥物-疾病關聯關系相結合,預測藥物的再利用適應癥。hetdr提出了一種基于異質網絡和文本挖掘的方法,可以結合藥物特征和生物醫學語料庫的疾病特征,實現更為精準的藥物預測。但是,文本挖掘方法受限于文本信息的質量、自然語言處理技術的準確性和數據源的融合難度等,難以發現潛在信息和網絡結構關系。
4、矩陣分解方法通過將實體間的聯系表示為一個二維矩陣,并將其分解為低秩子矩陣,表示潛在特征。例如,grpmf提出了一種利用藥物和疾病的相關數據,使用非負矩陣分解的方法來研究藥物重定位。bmf提出了一種基于多視圖學習和矩陣補全的藥物重定位方法,通過學習藥物和疾病的嵌入表示,預測新的藥物-疾病關聯。然而,這些方法也存在一些局限性,如數據稀疏性、數據源權重平衡、大規模數據處理等,需要在未來進一步探索和改進。基于網絡的方法通過將實體間的關系表示為一個異質網絡,并利用圖表示學習方法來學習網絡中節點和邊的特征表示。bifusion提出了一種二分圖卷積網絡模型,引入蛋白質節點作為不同生物域的直接信息傳遞以發現新的藥物適應癥。盡管基于網絡的方法可以充分挖掘網絡中的結構信息和拓撲信息,但是也存在一些挑戰,例如如何選擇合適的網絡結構,如何處理網絡中的噪聲和不完整性等。
5、在藥物重定位的研究過程中,數據的豐富度對于結果的影響至關重要。單層網絡可能會因為無法挖掘潛在信息,導致擬合不足。更多的已知關聯可以幫助模型學習藥物潛在特征,提高預測的準確性和方法的魯棒性。mpclcda提出了一種基于自動選擇的元路徑和對比學習的方法,利用元路徑構建一個新的異質網絡,并通過圖卷積網絡獲取節點的低維融合特征,預測circrna-疾病的關聯得分。然而,這些方法也存在一些不足,如忽略了藥物副作用等其他重要關聯,以及沒有充分利用多種元路徑等。
6、專利技術人在實施本實施例時發現現有藥物-疾病關聯預測方法的研究存在以下缺陷。
7、1.數據集不完善:以往的數據集長時間未更新,不完整的數據信息導致訓練的誤差增大,導致模型無法準確預測潛在的藥物-疾病關聯;
8、2.技術有缺陷:盡管近些年先進的深度學習技術的效果令人滿意,但是面對大規模的數據,并不能充分學習到潛在的關聯;
9、3.生物學機制不清晰:通過模型預測的藥物-疾病關聯缺乏一些可靠的驗證,不能很好的解釋藥物的作用機制和一些化學反應,不能清晰解釋藥物和疾病間的反應。
技術實現思路
1、針對現有技術中存在的問題,本專利技術提供了一種基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,至少部分的解決現有技術中存在的無法準確預測潛在的藥物-疾病關聯的問題。
2、本公開實施例提供了一種基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,包括:
3、基于多種實體構建三方網絡,所述實體包括藥物;
4、使用圖卷積神經網絡學習三方網絡中藥物的鄰居,提取節點結構信息特征并聚合給中心藥物節點,得到藥物向量;
5、基于藥物向量得到每個藥物在三方網絡中的表示矩陣;
6、基于表示矩陣使用自注意力機制得到藥物的注意力向量;
7、基于藥物的注意力向量得到藥物的嵌入向量特征表示;
8、基于嵌入向量特征表示對藥物疾病預測模型進行訓練,基于藥物疾病預測模型對藥物重定位。
9、可選的,基于嵌入向量特征對藥物疾病預測模型進行訓練,基于藥物疾病預測模型對藥物重定位的步驟之后還包括:
10、基于得分矩陣對藥物疾病預測模型進行優化。
11、可選的,所述基于多種實體構建三方網絡,包括:
12、構建藥物-疾病關聯矩陣,藥物-副作用關聯矩陣和藥物-蛋白質關聯矩陣,基于藥物-疾病關聯矩陣,藥物-副作用關聯矩陣和藥物-蛋白質關聯矩陣構建三方網絡。
13、可選的,所述使用圖卷積神經網絡學習三方網絡中藥物的鄰居,提取節點結構信息特征并聚合給中心藥物節點,包括:
14、從每種藥物的鄰居集合中進行采樣,得到藥物的嵌入向量,從而將鄰居集合中的k階鄰居的結構信息聚合到藥物節點,從而捕捉每種藥物在不同異質網絡的關聯,得到節點結構信息特征。
15、可選的,所述提取節點結構信息特征并聚合給中心藥物節點,包括:
16、對相鄰藥物節點和當前藥物節點的嵌入向量取平均,基于均值聚合器的圖卷積網絡聚合給中心藥物節點;
17、所述基于均值聚合器的圖卷積網絡為:
18、
19、其中,σ表示激活函數,代表第k階的可訓練的權重矩陣,代表網絡gp的第k層嵌入向量,ni,p表示藥物的鄰居集合。
20、可選的,基于表示矩陣使用自注意力機制得到藥物的注意力向量,包括:
21、使用自注意力機制分析藥物在異構網絡的關聯關系嵌入;
22、使用自注意力機制分析藥物在異構網絡的關聯關系嵌入包括使用非線性函數的輸出,對矩陣hi中的向量進行處理,然本文檔來自技高網...
【技術保護點】
1.一種基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,包括:
2.根據權利要求1所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,基于嵌入向量特征對藥物疾病預測模型進行訓練,基于藥物疾病預測模型對藥物重定位的步驟之后還包括:
3.根據權利要求2所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,所述基于多種實體構建三方網絡,包括:
4.根據權利要求3所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,所述使用圖卷積神經網絡學習三方網絡中藥物的鄰居,提取節點結構信息特征并聚合給中心藥物節點,包括:
5.根據權利要求4所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,所述提取節點結構信息特征并聚合給中心藥物節點,包括:
6.根據權利要求5所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,基于表示矩陣使用自注意力機制得到藥物的注意力向量,包括:
7.根據權利要求6所述的基于三方網
8.根據權利要求7所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,所述基于藥物的注意力向量得到藥物的嵌入向量特征表示,包括:
9.根據權利要求8所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,所述基于嵌入向量特征表示對藥物疾病預測模型進行訓練,包括:
10.根據權利要求9所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,基于得分矩陣對藥物疾病預測模型進行優化,包括:
...【技術特征摘要】
1.一種基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,包括:
2.根據權利要求1所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,基于嵌入向量特征對藥物疾病預測模型進行訓練,基于藥物疾病預測模型對藥物重定位的步驟之后還包括:
3.根據權利要求2所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,所述基于多種實體構建三方網絡,包括:
4.根據權利要求3所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,所述使用圖卷積神經網絡學習三方網絡中藥物的鄰居,提取節點結構信息特征并聚合給中心藥物節點,包括:
5.根據權利要求4所述的基于三方網絡和跨網絡嵌入圖卷積神經網絡的藥物重定位方法,其特征在于,所述提取節點結構信息特征并聚合給中心藥物節點,包括:
【專利技術屬性】
技術研發人員:曾攀,張博菲,劉傲航,孟亞潔,唐賢方,楊家亮,田埂,許俊林,
申請(專利權)人:元碼基因科技北京股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。