System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及智能計算與數據挖掘領域,特別涉及一種基于特征融合代理注意力圖卷積網絡的pirna-疾病關聯預測方法,簡稱pda-pagcn。
技術介紹
1、piwi-interacting?rna(pirna)是長度為26-31個核苷酸的小非編碼rna,在生物體內扮演著關鍵的調控角色。pirna通常與piwi蛋白相互作用,參與調節基因表達、抑制轉座子活性和表觀遺傳調控,對基因組的穩定性和生殖細胞的發育至關重要。近年來,越來越多的pirna被證明不僅在正常生理過程中發揮重要作用,而且與癌癥、神經退行性疾病等也密切相關,可視為腫瘤傳播擴散的啟動和控制因子。
2、隨著信息技術的發展與生物數據的增加,越來越多的pirna-疾病關聯得到證實。通過計算的方法預測與疾病相關的pirna能夠為生物學濕實驗縮小研究范圍,降低實驗成本,具有很好的輔助作用。現有預測疾病相關pirna的方法主要分為兩類:基于傳統機器學習的方法和基于圖神經網絡的方法。
3、基于傳統機器學習的pirna-疾病關聯預測方法主要從pirna和疾病特征向量的角度實現預測。例如,wei等人提出了一個pirna-疾病關聯預測方法ipidi-pul,基于三種異質生物數據源提取pirna與疾病特征,并采用陽性無標記學習的方法從所有未標記的pirna-疾病關聯中隨機選擇關聯對作為負樣本,然而忽略了在未標記的樣本中可能存在正關聯,從而導致分類器的召回率低,并且隨機選擇負樣本也無法保證方法的魯棒性與預測精度。為了解決上述問題,wei等人提出了一個關聯預測方法ipida-
4、基于圖神經網絡的pirna-疾病關聯預測方法主要利用圖神經網絡處理非線性數據的優勢預測疾病相關的pirna。例如,hou等人利用gcn能從復雜網絡中捕獲非線性關聯信息的性能,提出了一種新的計算方法ipida-gcn預測pirna-疾病關聯,設計了兩個gcn模塊捕獲不同生物網絡中豐富的語義信息以提取具有區分性的特征,充分利用了pirna與疾病個體與關聯對之間的信息,取得了較為準確的預測結果。zheng等人提出了一種基于圖注意力網絡的計算方法gapda用于識別潛在pirna-疾病關聯,將多角度的pirna-疾病關聯信息相結合構建一個新的屬性網絡,并通過包含注意力機制的圖神經網絡學習節點的特征預測潛在的pirna-疾病關聯。該方法首次將基于注意力的圖神經網絡引入到pirna-疾病關聯預測領域。hou等人構建了基于補充加權策略的方法ipida-swgcn預測pirna-疾病關聯,結合gcn提出補充加權策略以解決pirna-疾病異構網絡的高稀疏性問題。通過補充潛在的pirna-疾病關聯來豐富網絡結構信息,并對原始的布爾型pirna-疾病關聯分配不同的相關置信度,從不同的鄰居節點中學習節點表示,獲得了較好的預測性能。zhang等人構建了pda-prgcn,將子圖投影、節點特征增強和雙損失機制整合到gcn中,并基于pirna與疾病多源數據信息提取特征信息,從而可靠地預測pirna-疾病關聯。上述方法在預測過程中充分利用gcn聚合異構圖結構中節點和邊的信息以提取節點特征,提高了方法的預測性能。
技術實現思路
1、本專利技術的目的是提供一種基于特征融合代理注意力圖卷積網絡的pirna-疾病關聯預測方法,簡稱pda-pagcn,旨在運用圖卷積網絡方法,在一定程度上解決現有方法在預測pirna-疾病關聯計算方面,相關注意力機制限制了自注意力的全局感受野的問題。
2、本專利技術提供的技術方案如下:
3、步驟1:將pirna序列相似性和pirna高斯互作核相似性信息整合,將疾病語義相似性和疾病高斯互作核相似性信息整合,利用整合后的相似性信息與pirna-疾病關聯信息構建異構網絡。
4、步驟2:將異構網絡輸入到圖卷積網絡中提取特征,對特征按照維度分組后分別輸入到特征轉換網絡對特征空間轉換,以提取pirna和疾病的初始特征,同時引入層注意力機制,以解決圖卷積網絡不同層對節點特征貢獻不一致的問題。
5、步驟3:對轉換特征空間后的初始特征利用topk圖池化方法篩選以構建特征子圖。
6、步驟4:提出特征融合代理注意力機制,將特征子圖作為代理令牌與初始特征融合,重構pirna和疾病的特征,并通過計算余弦相似性得到pirna-疾病關聯重構分數。
本文檔來自技高網...【技術保護點】
1.一種基于特征融合代理注意力圖卷積網絡的piRNA-疾病關聯預測方法,其特征在于,包括以下步驟,
2.根據權利要求1所述的方法,其特征在于,步驟1中所述Topk圖池化方法是篩選通過特征轉換網絡對特征空間轉換后的初始特征,保留重要的piRNA與疾病特征信息并生成特征子圖,以降低特征的節點數,去除信息冗余的節點,為后續特征融合提供基礎,具體步驟如下;
3.根據權利要求1所述的方法,其特征在于,步驟2中所述特征融合代理注意力機制,是將Topk圖池化方法構建的特征子圖作為特征融合代理注意力機制的代理令牌,融合特征子圖與初始特征以重構piRNA和疾病的特征,并通過計算余弦相似性關聯分數得到piRNA-疾病關聯重構分數,具體步驟如下;
【技術特征摘要】
1.一種基于特征融合代理注意力圖卷積網絡的pirna-疾病關聯預測方法,其特征在于,包括以下步驟,
2.根據權利要求1所述的方法,其特征在于,步驟1中所述topk圖池化方法是篩選通過特征轉換網絡對特征空間轉換后的初始特征,保留重要的pirna與疾病特征信息并生成特征子圖,以降低特征的節點數,去除信息冗余的節點,為后...
【專利技術屬性】
技術研發人員:尚軍亮,趙臨千,孟祥涵,任倩倩,張媛媛,劉金星,
申請(專利權)人:曲阜師范大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。