System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及機器學(xué)習(xí),尤其涉及一種基于自注意力機制和對比學(xué)習(xí)的mirna-藥物關(guān)聯(lián)關(guān)系預(yù)測方法及系統(tǒng)。
技術(shù)介紹
1、micrornas(mirnas)是一類小的、非編碼的rna分子,在基因表達調(diào)控中起著關(guān)鍵作用。mirna可以通過調(diào)控藥物代謝酶的表達來影響藥物的代謝速率,從而影響藥物的療效和毒副作用。藥物可以通過影響mirna的表達水平來調(diào)節(jié)基因表達,從而影響細胞功能和生物過程。研究mirna與藥物之間的相互作用對于理解疾病的發(fā)生機制、藥物的作用機制以及藥物的發(fā)現(xiàn)和開發(fā)具有重要意義。mirna-藥物預(yù)測的研究旨在利用機器學(xué)習(xí)和生物信息學(xué)方法,從大量的實驗數(shù)據(jù)中挖掘出mirna與藥物之間的潛在相互作用,為疾病治療和藥物發(fā)現(xiàn)提供新的思路和方法。
2、例如,2021年,xu等人在結(jié)合了各種網(wǎng)絡(luò),包括mirna-藥物和mirna-疾病,來預(yù)測潛在的mirna-藥物關(guān)聯(lián)關(guān)系。deepthi和jereesh合并了mirna和藥物相似度數(shù)據(jù),利用cnn進行節(jié)點表示獲取,并應(yīng)用支持向量機識別未知的mirna-藥物關(guān)聯(lián)關(guān)系。2022年,guan等人利用卷積神經(jīng)網(wǎng)絡(luò)(cnn)獲取mirna和藥物特征,以及mirna-藥物網(wǎng)絡(luò)的拓撲特征。然后整合這些特征,并使用多層感知器(mlp)來預(yù)測未知的mirna-藥物關(guān)聯(lián)關(guān)系。2023年,wei等人基于圖協(xié)同過濾的多視圖對比學(xué)習(xí)模型gcfmcl,以預(yù)測mirna和藥物之間的敏感性關(guān)系。
3、盡管上述方法對mirna-藥物關(guān)聯(lián)的研究是有效的,但仍存在很多不足的地方。一方面,一些方法對
技術(shù)實現(xiàn)思路
1、本專利技術(shù)目的在于提供一種基于自注意力機制和對比學(xué)習(xí)的mirna-藥物關(guān)聯(lián)關(guān)系預(yù)測方法及系統(tǒng),以解決現(xiàn)有技術(shù)mirna-藥物預(yù)測對信息利用不充分,導(dǎo)致預(yù)測準確率較低的技術(shù)問題。
2、為實現(xiàn)上述目的,本專利技術(shù)提供了一種基于自注意力機制和對比學(xué)習(xí)的mirna-藥物關(guān)聯(lián)關(guān)系預(yù)測方法,包括以下步驟:
3、從藥物分子結(jié)構(gòu)圖中獲取第一特征向量,從mirna序列中獲取第二特征向量,將第一特征向量和第二特征向量分別作為藥物和mirna的初始輸入特征;
4、基于mirna-藥物關(guān)聯(lián)關(guān)系和初始輸入特征構(gòu)建mirna-藥物關(guān)聯(lián)圖,采用隨機游走的方法掩蓋關(guān)聯(lián)圖中的部分路徑得到掩碼圖;
5、將掩碼圖輸入到帶有自注意力機制的gcn(圖卷積)模型中進行編碼,再通過正樣本和負樣本進行對比學(xué)習(xí);正樣本為mirna-藥物關(guān)聯(lián)邊,負樣本為mirna-藥物未知關(guān)聯(lián)邊,對所有的已知和未知的mirna-藥物關(guān)聯(lián)關(guān)系對都使用解碼器進行解碼,以重構(gòu)mirna-藥物關(guān)聯(lián)圖;
6、最后,計算mirna-藥物關(guān)聯(lián)關(guān)系對的得分,預(yù)測mirna-藥物關(guān)聯(lián)性。
7、作為本專利技術(shù)的方法的進一步改進:
8、優(yōu)選地,從藥物分子結(jié)構(gòu)圖中獲取第一特征向量采用gin方法;從mirna序列中獲取第二特征向量采用k-mer方法。
9、優(yōu)選地,采用隨機游走的方法掩蓋關(guān)聯(lián)圖中的部分路徑得到掩碼圖,包括以下步驟:
10、基于伯努利分布選擇mirna-藥物關(guān)聯(lián)圖上的一些節(jié)點作為起始節(jié)點,將選擇的節(jié)點用一個集合表示,如下:
11、r~bernoulli(p)
12、其中,r表示根據(jù)伯努利分布從圖中采樣的起始節(jié)點集,p表示0到1之間的采樣率;
13、根據(jù)這些起始節(jié)點獲取路徑,然后使用隨機游走法進行掩碼,對存在的mirna-藥物關(guān)聯(lián)邊進行掩蓋操作,掩蓋的詳細計算策略如下:
14、εmask=randomwalk(r,lwalk)
15、其中,εmask表示隨機過程中的掩碼規(guī)則,lwalk表示隨機行走的路徑長度。
16、優(yōu)選地,帶有自注意力機制的gcn模型中的自注意力機制包括:線性變換、計算查詢和鍵之間的點積得分、softmax函數(shù)將其歸一化為注意力權(quán)重以及將多頭注意力的輸出連接起來:
17、通過線性變換fc_query、fc_key和fc_value,將輸入節(jié)點映射到查詢、鍵和值的空間,學(xué)習(xí)每個節(jié)點對其他節(jié)點的注意力值;給定輸入特征矩陣,通過三個線性變換wq,wk和wv將其映射到查詢q,鍵k和值v的空間,其公式如下:
18、q=x·wq,k=x·wk,v=x·wv
19、其中,·表示矩陣乘法;
20、計算查詢和鍵之間的點積得分scores:
21、
22、其中,是查詢或鍵的維度;
23、將點積得分經(jīng)過softmax函數(shù)進行歸一化,得到注意力權(quán)重,使用注意力權(quán)重將值加權(quán)求和,得到注意力機制的輸出。
24、優(yōu)選地,帶有自注意力機制的gcn模型包括丟棄層、卷積層、池化層、激活函數(shù)以及自注意力層;
25、將掩碼圖輸入到帶有自注意力機制的gcn模型中進行編碼包括:添加和平均鄰居節(jié)點的表示,執(zhí)行基于權(quán)重矩陣的線性變換,然后使用激活函數(shù)執(zhí)行非線性變換,它的層與層之間的傳播方式是:
26、
27、其中,σ表示激活函數(shù),h(l+1)表示第l+1層節(jié)點的特征矩陣,h(l)表示第l層節(jié)點的特征矩陣,w(l)表示第l層節(jié)點的可學(xué)習(xí)權(quán)重矩陣;具體來說,h0=x表示輸入mirna或藥物節(jié)點的初始特征矩陣;代表鄰接矩陣自環(huán),表示的度矩陣。
28、優(yōu)選地,通過正樣本和負樣本進行對比學(xué)習(xí),包括以下步驟:
29、獲取批量數(shù)據(jù)的大小,即正樣本和負樣本的數(shù)量,將正樣本和負樣本的模型輸出除以溫度參數(shù);
30、通過指數(shù)函數(shù)來計算正樣本之間的相似度和負樣本之間的相似度;
31、使用對比損失函數(shù)計算損失值,即計算負對數(shù)似然損失,公式如下:
32、
33、其中,n是批量數(shù)據(jù)的大小,表示正樣本和負樣本的數(shù)量;spos是正樣本的模型輸出除以溫度參數(shù)后的值;sneg是負樣本的模型輸出除以溫度參數(shù)后的值;對比損失函數(shù)的目標是最大化正樣本之間的相似度spos并最小化負樣本之間的相似度sneg;
34、將預(yù)測的分數(shù)與真實的標簽進行對比,并使用bce損失函數(shù)來計算損失值,公式如下:
35、edgeloss=(y-1)*log(1-p)-y*log(p)
36、其中,y表示mirna-藥物關(guān)聯(lián)關(guān)系對的真實標簽,p表示預(yù)測的mirna-藥物關(guān)聯(lián)關(guān)系對的得分;
37、最后,將bce損失和對比損失相加,得到總損失。
38、優(yōu)選地,計算mirna-藥物關(guān)聯(lián)關(guān)系對的得分,包括以下步驟:
39、基于gcn編碼器獲得的節(jié)點特征,計算mirna-藥物關(guān)聯(lián)關(guān)系對的阿達瑪積;
40、將阿達瑪積輸入mlp,使用激活函數(shù)計算mir本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種基于自注意力機制和對比學(xué)習(xí)的miRNA-藥物關(guān)聯(lián)關(guān)系預(yù)測方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,所述從藥物分子結(jié)構(gòu)圖中獲取第一特征向量采用GIN方法;從miRNA序列中獲取第二特征向量采用k-mer方法。
3.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,采用隨機游走的方法掩蓋所述關(guān)聯(lián)圖中的部分路徑得到掩碼圖,包括以下步驟:
4.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,帶有自注意力機制的GCN模型中的自注意力機制包括:線性變換、計算查詢和鍵之間的點積得分、softmax函數(shù)將其歸一化為注意力權(quán)重以及將多頭注意力的輸出連接起來:
5.根據(jù)權(quán)利要求4所述的預(yù)測方法,其特征在于,
6.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,所述通過正樣本和負樣本進行對比學(xué)習(xí),包括以下步驟:
7.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,所述計算miRNA-藥物關(guān)聯(lián)關(guān)系對的得分,包括以下步驟:
8.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,解碼器包括丟棄層、多層感知機和激活
9.一種基于自注意力機制和對比學(xué)習(xí)的miRNA-藥物關(guān)聯(lián)關(guān)系預(yù)測系統(tǒng),其特征在于,包括:特征獲取模塊、網(wǎng)絡(luò)構(gòu)建模塊、特征學(xué)習(xí)模塊、及關(guān)聯(lián)預(yù)測模塊;
...【技術(shù)特征摘要】
1.一種基于自注意力機制和對比學(xué)習(xí)的mirna-藥物關(guān)聯(lián)關(guān)系預(yù)測方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,所述從藥物分子結(jié)構(gòu)圖中獲取第一特征向量采用gin方法;從mirna序列中獲取第二特征向量采用k-mer方法。
3.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,采用隨機游走的方法掩蓋所述關(guān)聯(lián)圖中的部分路徑得到掩碼圖,包括以下步驟:
4.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于,帶有自注意力機制的gcn模型中的自注意力機制包括:線性變換、計算查詢和鍵之間的點積得分、softmax函數(shù)將其歸一化為注意力權(quán)重以及將多頭注意力的輸...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:嚴承,蔣繼譜,黃辛迪,
申請(專利權(quán))人:湖南中醫(yī)藥大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。