System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于生物醫學相關,更具體地,涉及一種基于元路徑嵌入的mirna-疾病關聯預測模型構建方法。
技術介紹
1、mirna是一類小非編碼rna分子,通過誘導mrna裂解和降解、翻譯抑制或其他形態控制機制來抑制靶基因的表達(bartel?d?p.micrornas:genomics,biogenesis,mechanism,and?function[j].cell,2004,116(2):281-297.)。近年來,許多研究表明mirna與許多重要的生物過程相關(gao?p,wong?c?c?l,tung?e?k?k,et?al.deregulation?ofmicrorna?expression?occurs?early?and?accumulates?in?early?stages?of?hbv-associated?multistep?hepatocarcinogenesis[j].journal?of?hepatology,2011,54(6):1177-1184.)。因此,發現更多mirna與疾病相關的信息可以更深入地了解疾病的分子機制,預測潛在的mirna與疾病的關聯可以在第一時間有效預防潛在的疾病靶標,并可以進一步改善復雜人類疾病的診斷、預后和治療(hart?m,wach?s,nolte?e,et?al.the?proto-oncogene?erg?is?a?target?of?micro?rna?mir-145in?prostate?cancer[j].the?febsjournal,2013,280(9):2
2、然而,通過生物實驗獲取mirna-疾病關聯信息既費力又昂貴,因此,研究人員越來越傾向于開發計算方法和算法模型,利用現有數據庫構建mirna和疾病關聯的網絡(即mirna-疾病網絡),通過該種網絡來預測潛在的mirna與疾病的關聯信息,從而減少生物實驗的成本。許多基于網絡模型的方法在這方面取得了成功(xuan?p,han?k,guo?y,etal.prediction?of?potential?disease-associated?micrornas?based?on?random?walk[j].bioinformatics,2015,31(11):1805-1815.)。隨著機器學習在研究中的地位日益突出,研究人員越來越多地采用這些方法來訓練mirna、疾病相關數據,并取得了顯著的成功(chen?x,wang?l,qu?j,et?al.predicting?mirna–disease?association?based?oninductive?matrix?completion[j].bioinformatics,2018,34(24):4256-4265.)。針對網絡模型的圖機器學習方法也日益發展,網絡嵌入方法是機器學習在網絡模型上的重要應用,這些網絡嵌入方法可以從網絡中自動提取節點的特征嵌入,在盡可能保留網絡結構信息的前提下,利用低維特征向量來表示網絡中的節點,使下游的鏈接預測、節點分類等任務更加高效。許多通用的網絡嵌入方法被提出,如deepwalk、node2vec、sdne等,并且被有效應用在生物信息學研究中(chen?z,wang?x,gao?p,etal.predicting?disease?relatedmicrorna?based?on?similarity?and?topology[j].cells,2019,8(11):1405.)。但值得注意的是,它們主要關注同構網絡,而mirna-疾病關聯網絡是異構的。因此,目前通用的網絡嵌入方法不能有效挖掘mirna-疾病網絡中的結構信息,以進而獲知mirna和疾病之間的關聯信息,需要一種能夠適用于mirna-疾病關聯異構網絡的網絡嵌入方法,并且匹配合適的算法模型,進行mirna-疾病關聯預測。
技術實現思路
1、針對現有技術的以上缺陷或改進需求,本專利技術提供了一種基于元路徑嵌入的mirna-疾病關聯預測模型構建方法,其目的在于提出一種適用于mirna-疾病關聯異構網絡的網絡嵌入方法,提高mirna和疾病關聯精確度。
2、為實現上述目的,按照本專利技術的一個方面,提供了一種基于元路徑嵌入的mirna-疾病關聯預測模型構建方法,包括:
3、基于預設的mirna和疾病關聯數據庫,將其中的mirna和疾病均作為網絡中的節點,將已知相關聯的mirna和疾病節點連線作為網絡中的邊,且區分mirna、疾病兩類節點的類型,構建mirna-疾病異構網絡;
4、采用預設的元路徑,以網絡中的每個節點為起始節點,在mirna-疾病異構網絡上引導隨機游走,生成該節點對應的一系列游走節點序列;利用異構skip-gram,基于所有游走節點序列,提取得到所述mirna和疾病關聯數據庫中每個mirna和疾病的特征嵌入;
5、采用所述mirna和疾病關聯數據庫的mirna和疾病所對應的特征嵌入構建二分類的訓練樣本集,訓練分類器,得到mirna-疾病關聯預測模型。
6、進一步,所述元路徑為:疾病→mirna→疾病。
7、進一步,所述分類器為xgboost分類器。
8、進一步,所述xgboost分類器是通過集成學習的方式訓練得到。
9、進一步,所述訓練樣本集包括:
10、采用所述mirna和疾病關聯數據庫中所有已知關聯性的各對mirna和疾病所對應的特征嵌入構建正樣本,采用所述mirna和疾病關聯數據庫中無關聯性的mirna和疾病所對應的特征嵌入構建數量同正樣本的負樣本。
11、按照本專利技術的另一方面,提供了一種mirna-疾病關聯預測方法,包括:
12、采用如上所述的mirna-疾病關聯預測模型構建方法所構建的mirna-疾病關聯預測模型,基于待預測的mirna和疾病的特征嵌入,預測得到該mirna和該疾病之間的關聯性。
13、按照本專利技術的另一方面,提供了一種電子設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現如上所述的方法的步驟。
14、按照本專利技術的另一方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質包括存儲的計算機程序,其中,在所述計算機程序被處理器運行時控制所述存儲介質所在設備執行如上所述的方法的步驟。
15、按照本專利技術的另一方面,提供了一種計算機程序產品,包括計算機程序或指令,所述計算機程序或指令被處理器執行時實現如上所述的方法的步驟。
16、總體而言,通過本專利技術所構思的以上技術方案與現有技術相比,本專利技術提供的方案主要具有以下有益效果:
17、1.本專利技術提出一種基于元路徑嵌入的mirna-疾病關聯預測模型構建方法,在生物醫學網絡模型中預測潛在的mirna-疾病關聯時,必須考慮到網絡的異構性,本專利技術提出一種mirna-疾病異構網絡構建方式,該網絡包含不同類型的節點——mirna和疾病。進一本文檔來自技高網...
【技術保護點】
1.一種基于元路徑嵌入的miRNA-疾病關聯預測模型構建方法,其特征在于,包括:
2.如權利要求1所述的miRNA-疾病關聯預測模型構建方法,其特征在于,所述元路徑為:疾病→miRNA→疾病。
3.如權利要求1所述的miRNA-疾病關聯預測模型構建方法,其特征在于,所述分類器為XGBoost分類器。
4.如權利要求3所述的miRNA-疾病關聯預測模型構建方法,其特征在于,所述XGBoost分類器是通過集成學習的方式訓練得到。
5.如權利要求1所述的miRNA-疾病關聯預測模型構建方法,其特征在于,所述訓練樣本集包括:
6.一種miRNA-疾病關聯預測方法,其特征在于,包括:
7.一種電子設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1至5中任一項所述的方法的步驟和/或如權利要求6所述的方法的步驟。
8.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質包括存儲的計算機程序,其中,在所述計算機程序被處理器運行時控制所述存儲介質所
9.一種計算機程序產品,包括計算機程序或指令,其特征在于,所述計算機程序或指令被處理器執行時實現如權利要求1至5中任一項所述的方法的步驟和/或如權利要求6所述的方法的步驟。
...【技術特征摘要】
1.一種基于元路徑嵌入的mirna-疾病關聯預測模型構建方法,其特征在于,包括:
2.如權利要求1所述的mirna-疾病關聯預測模型構建方法,其特征在于,所述元路徑為:疾病→mirna→疾病。
3.如權利要求1所述的mirna-疾病關聯預測模型構建方法,其特征在于,所述分類器為xgboost分類器。
4.如權利要求3所述的mirna-疾病關聯預測模型構建方法,其特征在于,所述xgboost分類器是通過集成學習的方式訓練得到。
5.如權利要求1所述的mirna-疾病關聯預測模型構建方法,其特征在于,所述訓練樣本集包括:
6.一種mirna-疾病關聯預測方法,其特征在于,...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。