System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及復雜網絡和人工智能生物信息學領域,尤其基于多模態transformer的代謝物-藥物細粒度相互作用預測技術。
技術介紹
1、藥物代謝組學作為一門新興學科,專注于探究藥物引發的體內代謝變化。相比于其他組學,其優勢在于:(1)通過分析藥物對代謝物的影響,能清晰揭示藥物如何通過調節代謝途徑實現治療效果或產生副作用。(2)個體間的藥物代謝差異可作為評估藥物療效與毒性的重要指標,為精準醫療提供科學依據。(3)藥物代謝組學有助于發現與藥物療效及毒性緊密相關的生物標志物,促進早期療效評估、劑量調整及不良反應預測。因此,深入理解和揭示代謝物與藥物間的復雜相互作用,對于加速藥物研發進程、優化臨床治療效果具有重要意義。
2、盡管高通量代謝組學技術能夠檢測部分代謝物-藥物相互作用,但其耗時且成本高昂,限制了藥物研發的進程。近年來,計算方法在預測生物網絡潛在關聯上取得進展,如代謝物-疾病、藥物-靶點等,但代謝物-藥物相互作用的預測方法尚未得到廣泛研究。目前,這些方法面臨以下挑戰:首先,它們多依賴粗粒度圖譜,僅能預測基本關聯性,難以深入揭示復雜的調控機制,即無法精確描述藥物如何影響代謝物水平(上調、下調或不變)。其次,單一層面數據易受噪聲干擾,難以全面體現生物系統的復雜性和動態性,迫切需要整合多組學數據,構建全面的多模態網絡。最后,現有預測模型在特征提取和表示上能力不足,難以有效捕捉和解析多模態數據中的復雜關系,從而限制了預測性能和泛化能力。
技術實現思路
1、針對現有技術存在的缺
2、為實現上述目的,本專利技術采用了如下技術方案:
3、基于多模態transformer的代謝物-藥物細粒度相互作用預測方法,包括以下步驟:
4、s1、構建細粒度代謝物-藥物相互作用圖譜:人類已知的代謝物-藥物關聯數據主要源自drugbank數據庫中的″藥物代謝組學″模塊,本方法根據藥物使用前后代謝物濃度的變化,將這些相互作用關系進一步細化為三種調節類型:濃度增加視為上調(ur),濃度降低視為下調(dr),以及無明顯變化視為無關聯(nr)。經過數據預處理之后,利用知識圖譜構建技術,成功構建了一個細粒度的代謝物-藥物相互作用圖譜。
5、s2、構建多模態網絡:基于步驟1構造的細粒度代謝物-藥物相互作用圖譜,加入疾病和基因信息構造多模態網絡以更加全面地反映生物系統的復雜性和多樣性,代謝物-<疾病,基因>-藥物的多模態網絡定義為g=(v,e,f),其中v={vm,vd,vdi,vg}表示代謝物、藥物、疾病和基因的節點集合,e={eur,edr,emdi,emg,eddi,edg}表示六種類型的邊集合,分別是:上調、下調、影響、調控、治療和作用。f={fm,fd,fdi,fg}表示節點的初始特征集合。
6、s3、基于元路徑的語義網絡構建:元路徑(p)是一種指定節點類型和邊類型的路徑模式,用于捕獲不同類型節點之間的語義信息。本方法基于步驟2構造的多模態網絡,定義了6條元路徑,分別是:vmeurvd、vmedrvd、vmemdivdi、vmemgvg、vdeddivdi、vdedgvg,并根據這些元路徑構造了其對應的語義網絡,其鄰接矩陣表示為ap。
7、s4、元路徑感知的輸入序列構造:基于步驟3構造的語義網絡ap,首先需要將圖的信息(包括節點特征和圖結構)集成到transformer架構中,以學習不同節點間的全局依賴關系。本方法分別融合了生化特征hp、結構特征up和中心性特征cp構成語義網絡ap下的綜合特征矩陣xp,然后利用元路徑感知的多跳鄰居聚合策略得到元路徑p下節點i的k跳輸入序列
8、s5、基于transformer的模態內交互:步驟4構造的輸入序列sp,i經過特征轉化得到映射的特征矩陣并將其輸入到transformer編碼器中,經過l層特征學習之后得到元路徑p下的節點i的k跳嵌入為了實現同一元路徑內不同跳嵌入的精細聚合,本方法引入注意力機制得到節點i在元路徑p中的模態內交互嵌入zp,i。
9、s6、基于級聯模型的模態間交互:基于步驟3定義的元路徑vmemdivdi和vmemgvg,并根據步驟5得到更新后的代謝物特征同樣地,基于vdeddivdi和vdedgvg得到更新后的藥物特征他們均有效融入了疾病和基因維度的特征信息。隨后將和輸入到細粒度代謝物-藥物相互作用圖譜(vmeurvd和vmedrvd)得到全局視圖下的模態間交互嵌入zi。
10、s7、解碼重構關聯概率:本方法首先將步驟6中獲取的節點特征通過拼接操作轉化為邊特征。隨后,利用多層感知機(mlp)對這些特征進行解碼,最終輸出預測概率其表示代謝物和藥物之間的關聯關系歸屬于某一特定類別的概率。
11、s8、方法性能評估:利用五折交叉驗證來全面評估所提方法的性能,具體評價指標包括accuracy(acc);宏觀層面指標包括macro?precision(ma?pre)、macro?recall(marecall)、macro?f1?score(ma?f1)、macro?auc和macro?aupr;微觀層面指標包括micro?auc和micro?aupr。
12、進一步的,所述步驟s1的具體子步驟如下:
13、s1-1、數據收集:代謝物和藥物相互作用數據主要來源于drugbank數據庫中的藥物代謝組學模塊,該模塊詳盡記錄了藥物化合物在代謝過程中引起的代謝物濃度變化,共計包含3084個相互作用條目。
14、s1-2、數據預處理:使用hmdb?id和drugbank?id作為規范,對代謝物和藥物的命名進行歸一化,刪除節點重復項和調控關系不明確的一對多噪聲數據。
15、s1-3、數據集成,構建細粒度圖譜:本方法根據藥物使用前后代謝物濃度的變化,將這些相互作用關系進一步細化為三種調節類型r={ur:1,dr:2,nr:0}。其中,濃度增加視為上調(ur),濃度降低視為下調(dr),以及無明顯變化視為無關聯(nr)。最后利用知識圖譜構建技術得到細粒度的代謝物-藥物相互作用圖譜,該圖譜包括415種代謝物、645種藥物和2,196個關聯關系(其中1,055個上調關系和1,141個下調關系)。
16、進一步的,所述步驟s2的具體子步驟如下:
17、s2-1、代謝物-疾病和代謝物-基因關聯,代謝物結構和基因序列信息:首先從hmdb數據庫中的″疾病″和″蛋白質″模塊分別收集代謝物-疾病關聯和代謝物-基因關聯數據。此外,從hmdb數據庫中提取了415種代謝物的分子結構信息(smiles格式)和566個基因的序列信息用于后續初始生化特征構建。
18、s2-2、藥物-基因關聯和藥物結構信息:從drugbank數據庫中收集藥物-基因關聯數據和645種藥物的分子結構信息(smiles格式)。
19、s2-3、藥物-疾病關聯和本文檔來自技高網...
【技術保護點】
1.基于多模態Transformer的代謝物-藥物細粒度相互作用預測方法,其特征在于,其步驟為:
【技術特征摘要】
1.基于多模態transformer的代謝物-藥...
【專利技術屬性】
技術研發人員:盧鵬麗,劉文智,薛景今,董超,葛瑜,
申請(專利權)人:蘭州理工大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。