一種多源數據融合的藥物不良反應智能預測方法及裝置制造方法及圖紙

技術編號：44458273 閱讀：4 留言：0更新日期：2025-02-28 19:05

本申請的實施例公開了一種多源數據融合的藥物不良反應智能預測方法及裝置，涉及藥物?基因?藥物不良反應神經網絡技術領域，旨在解決現有技術缺乏更有效的特征分析方法和設計更高效的模型，因此預測ADR的性能較低的問題。所述方法包括：獲取多源數據；對所述多源數據進行標準化處理后，構建藥物描述符特征，獲得藥物相似性向量集合；構建藥物不良反應描述符特征，獲得藥物不良反應相似性向量集合；基于所述藥物相似性向量集合和所述藥物不良反應相似性向量集合，對所述目標藥物不良反應智能預測模型進行訓練，訓練完成后，基于所述目標藥物不良反應智能預測模型，對當將目標藥物用于目標個體時所產生的不良反應進行預測。

全部詳細技術資料下載

【技術實現步驟摘要】

本申請涉及藥物-基因-藥物不良反應神經網絡，具體涉及一種多源數據融合的藥物不良反應智能預測方法及裝置。

技術介紹

1、藥物不良反應(adrs)是臨床治療中的一個重要問題，可能產生嚴重的健康風險甚至導致死亡。當前對臨床觀測的藥物基因組學數據的搜集大幅增加，為基于已有經驗預測adr提供了可能。面對大量且復雜多樣的藥物基因組學數據，如果高效發掘其中的規律，更好地指導未知adr的預測對臨床藥物警戒起到至關重要的作用。近年來，具有超高運算力和人工智能分析力的計算機技術及相關算法在輔助臨床adr預測分析中的作用愈發顯著，但如何有效處理這些海量數據并挖掘其蘊含的客觀規律以進行精確預測仍然是一個巨大挑戰。現有的研究利用了諸如lincs?l1000項目、stitch數據庫以及比較毒物基因組學數據庫(comparative?toxicogenomics?database，ctd)等源數據來構建模型，并取得了一定的成功。但這些方法在有效特征提取、最優化模型結構設計等方面仍存在一些不足。此外，盡管這些公開的源數據庫為adr預測提供了豐富的基因組學信息基礎，但是龐大的基因數據量也給特征處理和模型設計帶來了不小的挑戰。因此，需要開發更有效的特征分析方法和設計更高效的模型，以進一步提升預測adr的性能。

技術實現思路

1、本申請的主要目的在于提供一種多源數據融合的藥物不良反應智能預測方法及裝置，旨在解決現有技術缺乏更有效的特征分析方法和設計更高效的模型，因此預測adr的性能較低的問題。

2、為實現上

3、第一方面，本申請實施例提供一種多源數據融合的藥物不良反應智能預測方法，包括以下步驟：

4、獲取多源數據；其中，所述多源數據包括比較毒理學基因組學數據、lincs?l1000數據、pubchem數據、醫學主題詞表數據以及sider數據；所述比較毒理學基因組學數據用于闡釋藥物-基因相互作用，所述lincs?l1000數據用于闡釋基因表達信號，所述pubchem數據用于闡釋藥物smiles，所述醫學主題詞表數據用于闡釋基因-疾病相互作用，所述sider數據用于闡釋藥物-副作用對；

5、對所述多源數據進行標準化處理后，構建藥物描述符特征，獲得藥物相似性向量集合；構建藥物不良反應描述符特征，獲得藥物不良反應相似性向量集合；

6、基于所述藥物相似性向量集合和所述藥物不良反應相似性向量集合，對所述目標藥物不良反應智能預測模型進行訓練，訓練完成后，基于所述目標藥物不良反應智能預測模型，對當將目標藥物用于目標個體時所產生的不良反應進行預測。

7、作為本申請一些可選方式，所述藥物相似性向量集合包括：兩個藥物的化學結構相似性、基于藥物-基因相互作用的藥物相似性和經藥物擾動后基因表達差異的藥物相似性；

8、所述藥物不良反應相似性向量集合包括：不同的疾病本體的語義相似度和基因-疾病關聯關系集合。

9、作為本申請一些可選方式，所述兩個藥物的化學結構相似性值是基于以下步驟獲得的：

10、通過利用sider中提供的藥物compound?id，從pubchem批量下載每種藥物結構的smiles字符串表示，再使用python中的rdkit工具將其轉換為拓撲指紋；所述拓撲指紋是基于分子中的四元環的拓撲結構和旋轉角度產生，用于描述分子的立體化學和相互作用；并采用tanimoto系數作為度量標準，獲取藥物di和藥物dj兩個藥物的化學結構相似性值(表示藥物-藥物在藥物化學結構空間上的相似性，其中cs(i,j)表示兩個不同的藥物的化學空間結構)。

11、作為本申請一些可選方式，所述基于藥物-基因相互作用的藥物相似性是指：

12、藥物-基因相互作用通過one-hot編碼表示，即將每個獨特的基因相互作用轉換為一個二進制向量；藥物di和藥物dj基于藥物-基因相互作用的相似性使用jaccard指數計算，公式為：

13、

14、其中，gti和gtj分別表示與藥物di和dj存在相互作用關系的基因集合。

15、作為本申請一些可選方式，所述經藥物擾動后基因表達差異的藥物相似性是指：

16、藥物di和dj基于經藥物擾動后基因表達差異的相似性通過余弦相似性公式計算，公式為：

17、

18、其中，和表示藥物i或j經過擾動后的基因表達特征向量，和表示向量和的范數。

19、作為本申請一些可選方式，所述不同的疾病本體的語義相似度通過以下步驟獲得：

20、針對每個藥物不良反應，研究基于其在mesh中的層次描述符構建了一個有向無環圖，其中節點表示不良反應在mesh中的節點，邊表示當前節點與其祖先之間的關系；不良反應s表示為圖dags＝(s,ns,es)，其中ns表示包括不良反應s節點本身在內的所有祖先節點的集合，es則表示包含的所有由父節點指向子節點的邊集合；為以可測量的格式對疾病本體術語的語義進行編碼，研究定義了疾病a的語義值sv(a)為daga中所有疾病對疾病a語義的總貢獻，其中靠近疾病a的疾病術語對其語義的貢獻更大；對于兩個不同的疾病本體a和b，a和b的語義相似度s(a,b)定義為：

21、

22、作為本申請一些可選方式，所述基因-疾病關聯關系集合通過以下步驟獲得：

23、從ctd下載了化合物-基因相互關系表ctd_genes_diseases.csv.gz，作為知識圖譜的基因-疾病關聯關系集合，包含107,911,805條基因-疾病關聯記錄；ctd中的基因-疾病關聯包括專家提取和推斷的關聯；提取的關聯由ctd策展人從已發表的文獻中策劃提取，或使用ncbi基因數據庫中的mim2gene文件從omim數據庫中導出；基因-疾病直接關聯有三種類型的證據：m標記、機制和治療證據；m標記指的是基因序列中的特定變異；機制證據包括基因變異如何影響蛋白質的結構和功能，以及這些變化如何干擾正常細胞或生理過程；治療證據指的是通過針對特定基因或其產物的治療可以改善疾病癥狀或預防疾病的發生。

24、作為本申請一些可選方式，所述目標藥物不良反應智能預測模型通過藥物原始特征組合drug、特征交叉vfcs、藥物不良反應原始特征side組合分別通過三個支路進行訓練；

25、其中，drug和side使用兩個結構一致的線性子網絡進行學習，而vfcs使用一個卷積神經網絡子網絡進行學習；線性子網絡的架構由兩個全連接層、一個批量歸一化層和一個激活函數層組成；即：

26、om,k＝dropout(p)(relu(fcn1(cat(xm,ck)))),

27、x′m,k＝linear(om,k),

28、其中，x′m,k在lsnd和lsns中分別表示具有k個不同相似度特征的m個藥物和m個藥物不良反應的潛在表示，即lsn的輸出。其中，lsnd和lsns表示兩個結構一致的線性子網絡(linear?s本文檔來自技高網...

【技術保護點】

1.一種多源數據融合的藥物不良反應智能預測方法，其特征在于，包括以下步驟：

2.根據權利要求1所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述藥物相似性向量集合包括：兩個藥物的化學結構相似性、基于藥物-基因相互作用的藥物相似性和經藥物擾動后基因表達差異的藥物相似性；

3.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述兩個藥物的化學結構相似性值是基于以下步驟獲得的：

4.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述基于藥物-基因相互作用的藥物相似性是指：

5.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述經藥物擾動后基因表達差異的藥物相似性是指：

6.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述不同的疾病本體的語義相似度通過以下步驟獲得：

7.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述基因-疾病關聯關系集合通過以下步驟獲得：

8.根據權利要求

9.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述目標藥物不良反應智能預測模型是通過將embdrugs、embcross和embADRs拼接后作為輸入向量輸入多標簽分類器進行分類；分類器由兩個全連接層、兩個激活函數層和一個BN層組成；最終輸出一個向量，其中大于0的數字表示藥物和ADR之間的關聯，數字越大表示關聯的可能性越大；所述輸出向量滿足以下關系式：

10.一種多源數據融合的藥物不良反應智能預測裝置，其特征在于，包括：

...

【技術特征摘要】

1.一種多源數據融合的藥物不良反應智能預測方法，其特征在于，包括以下步驟：

3.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述兩個藥物的化學結構相似性值是基于以下步驟獲得的：

4.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述基于藥物-基因相互作用的藥物相似性是指：

5.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述經藥物擾動后基因表達差異的藥物相似性是指：

6.根據權利要求2所述多源數據融合的藥物不良反應智能預測方法，其特征在于，所述不同的疾病本體的語義相似度通過以下步驟獲得：<...

【專利技術屬性】
技術研發人員：蔡永銘，郭哲桐，高少熙，趙豐，楊柳媚，韓芳芳，李雄，仇志坤，楊澤銳，
申請(專利權)人：廣東藥科大學，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術