System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請(qǐng)涉及人工智能,尤其涉及蛋白質(zhì)模型質(zhì)量評(píng)估方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、蛋白質(zhì)在幾乎所有的生物過(guò)程中是普遍存在的。確定它們的結(jié)構(gòu)和功能有助于理解并潛在地控制這些過(guò)程。然而,盡管蛋白質(zhì)序列的測(cè)定現(xiàn)在是一個(gè)常規(guī)的程序,但利用這些信息來(lái)提取所研究系統(tǒng)的相關(guān)功能知識(shí)往往是非常困難的。事實(shí)上,蛋白質(zhì)的功能依賴于其化學(xué)性質(zhì)和機(jī)械性質(zhì)的結(jié)合,這是由其結(jié)構(gòu)決定的。因此,從其序列中鑒定蛋白質(zhì)結(jié)構(gòu)是非常重要的,盡管是一項(xiàng)艱巨的任務(wù)。實(shí)驗(yàn)結(jié)構(gòu)識(shí)別并非在所有情況下都可行,并且通常非常繁瑣且昂貴。因此,過(guò)去出現(xiàn)了試圖從其序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的計(jì)算方法。這些方法大多數(shù)都將蛋白質(zhì)構(gòu)象的采樣步驟與模型質(zhì)量評(píng)估步驟結(jié)合在一起,前者產(chǎn)生蛋白質(zhì)構(gòu)象,而后者對(duì)這些構(gòu)象評(píng)分以選擇與天然結(jié)構(gòu)盡可能接近的蛋白質(zhì)構(gòu)象。蛋白質(zhì)模型質(zhì)量評(píng)估是結(jié)構(gòu)生物信息學(xué)中一個(gè)重要而又亟待解決的問(wèn)題。
2、現(xiàn)有一種蛋白質(zhì)模型質(zhì)量評(píng)估方法,通過(guò)使用從一般物理原理中導(dǎo)出的能量函數(shù)來(lái)解決評(píng)分問(wèn)題,例如charmm,amber,opls,gromos,從不同的已知蛋白質(zhì)和rna結(jié)構(gòu)打分集中推導(dǎo),例如goap,rw,dfire,或者以上兩者都有,例如rosetta。他們通常估算計(jì)算模型和參考結(jié)構(gòu)之間的特定相似性得分,例如lddt、cad、gdt、tmscore等。最近,各種基于學(xué)習(xí)的方法被開(kāi)發(fā)出來(lái)。他們通過(guò)利用人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、cnn、lstm、gcn和3d模型進(jìn)行相似性預(yù)測(cè)。
3、然而,申請(qǐng)人發(fā)現(xiàn),它們都不能預(yù)測(cè)原子水平的proteinqa結(jié)果,因?yàn)?span style='display:none'>對(duì)所有蛋白質(zhì)和rna結(jié)構(gòu)打分的原子推斷是非常密集的計(jì)算。此外,它們不能同時(shí)考慮原子之間的拓?fù)浜蛶缀侮P(guān)系,從而導(dǎo)致傳統(tǒng)的蛋白質(zhì)模型質(zhì)量評(píng)估方法存在評(píng)估準(zhǔn)確性較低的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例的目的在于提出蛋白質(zhì)模型質(zhì)量評(píng)估方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),以解決傳統(tǒng)的蛋白質(zhì)模型質(zhì)量評(píng)估方法存在評(píng)估準(zhǔn)確性較低的問(wèn)題。
2、為了解決上述技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例提供一種蛋白質(zhì)模型質(zhì)量評(píng)估方法,采用了如下所述的技術(shù)方案:
3、接收用戶終端輸入的pdb文件,其中,所述pdb文件包含蛋白質(zhì)和rna結(jié)構(gòu)打分中每個(gè)原子的特征;
4、根據(jù)所述蛋白質(zhì)和rna結(jié)構(gòu)打分中每個(gè)原子的特征以及預(yù)設(shè)算法構(gòu)建atom-proteinqa模型;
5、接收用戶終端發(fā)送的質(zhì)量評(píng)估請(qǐng)求,其中,所述質(zhì)量評(píng)估請(qǐng)求至少包括待評(píng)估的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù);
6、將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述atom-proteinqa模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果。
7、進(jìn)一步的,所述預(yù)設(shè)算法首先搜索半徑為pn的原子pn[i,j]的鄰居,然后,通過(guò)預(yù)設(shè)指數(shù)選擇pm和pn中的相鄰原子,并分別計(jì)算所述相鄰原子到pm[i,j]和pn[i,j]的各自距離,pm和pn中單個(gè)距離之間的差值將通過(guò)映射函數(shù)轉(zhuǎn)換為預(yù)定義的分?jǐn)?shù),最后,通過(guò)對(duì)總鄰數(shù)進(jìn)行歸一化,獲得在原子、殘基和全局水平上的lddt分?jǐn)?shù)。
8、進(jìn)一步的,所述atom-proteinqa模型包括幾何感知模塊,所述將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述atom-proteinqa模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果的步驟,具體包括下述步驟:
9、對(duì)所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)進(jìn)行特征提取操作,得到所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)中每個(gè)殘基原子的體素化笛卡爾坐標(biāo);
10、根據(jù)所述幾何感知模塊捕捉所述體素化笛卡爾坐標(biāo)的幾何特征,生成第一原子級(jí)預(yù)測(cè)結(jié)果。
11、進(jìn)一步的,所述atom-proteinqa模型包括拓?fù)涓兄K,所述將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述atom-proteinqa模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果的步驟,具體包括下述步驟:
12、根據(jù)所述拓?fù)涓兄K構(gòu)建與所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)相對(duì)應(yīng)的原子級(jí)拓?fù)鋱D;
13、根據(jù)所述原子級(jí)拓?fù)鋱D以及消息傳遞機(jī)制輸出第二原子級(jí)預(yù)測(cè)結(jié)果。
14、進(jìn)一步的,所述atom-proteinqa模型包括幾何感知模塊、拓?fù)涓兄K以及交叉模型融合模塊,所述將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述atom-proteinqa模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果的步驟,具體包括下述步驟:
15、根據(jù)所述幾何感知模塊獲取所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的原子特征數(shù)據(jù);
16、根據(jù)所述拓?fù)涓兄K獲取所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的初始拓?fù)鋱D;
17、根據(jù)交叉模型融合模塊對(duì)所述原子特征以及所述拓?fù)鋱D進(jìn)行特征融合操作,得到更新拓?fù)鋱D;
18、根據(jù)所述拓?fù)涓兄K以及消息傳遞機(jī)制對(duì)所述更新拓?fù)鋱D進(jìn)行質(zhì)量預(yù)測(cè)操作,得到第三原子級(jí)預(yù)測(cè)結(jié)果。
19、為了解決上述技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例還提供一種蛋白質(zhì)模型質(zhì)量評(píng)估裝置,采用了如下所述的技術(shù)方案:
20、文件獲取模塊,用于接收用戶終端輸入的pdb文件,其中,所述pdb文件包含蛋白質(zhì)和rna結(jié)構(gòu)打分中每個(gè)原子的特征;
21、模型構(gòu)建模塊,用于根據(jù)所述蛋白質(zhì)和rna結(jié)構(gòu)打分中每個(gè)原子的特征以及預(yù)設(shè)算法構(gòu)建atom-proteinqa模型;
22、請(qǐng)求獲取模塊,用于接收用戶終端發(fā)送的質(zhì)量評(píng)估請(qǐng)求,其中,所述質(zhì)量評(píng)估請(qǐng)求至少包括待評(píng)估的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù);
23、質(zhì)量評(píng)估模塊,用于將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述atom-proteinqa模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果。
24、進(jìn)一步的,所述atom-proteinqa模型包括幾何感知模塊,所述質(zhì)量評(píng)估模塊包括:
25、特征提取子模塊,用于對(duì)所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)進(jìn)行特征提取操作,得到所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)中每個(gè)殘基原子的體素化笛卡爾坐標(biāo);
26、第一預(yù)測(cè)子模塊,用于根據(jù)所述幾何感知模塊捕捉所述體素化笛卡爾坐標(biāo)的幾何特征,生成第一原子級(jí)預(yù)測(cè)結(jié)果。
27、進(jìn)一步的,所述atom-proteinqa模型包括拓?fù)涓兄K,所述質(zhì)量評(píng)估模塊包括:
28、拓?fù)鋱D構(gòu)建子模塊,用于根據(jù)所述拓?fù)涓兄K構(gòu)建與所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)相對(duì)應(yīng)的原子級(jí)拓?fù)鋱D;
29、第二預(yù)測(cè)子模塊,用于根據(jù)所述原子級(jí)拓?fù)鋱D以及消息傳遞機(jī)制輸出第二原子級(jí)預(yù)測(cè)結(jié)果。
30、進(jìn)一步的,所述atom-proteinqa模型包括幾何感知模塊,所述計(jì)算模塊包括:
31、原子特征獲取子模塊,用于根據(jù)所述幾何感知模塊獲取所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的原子特征數(shù)據(jù);
32、初始拓?fù)鋱D獲取子模塊,用于根據(jù)所述拓?fù)涓兄K獲取所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的初始拓?fù)鋱D;
33、特征融合子模塊,用于根據(jù)交叉模型融合模塊對(duì)所述原子特征以及所述拓?fù)鋱D進(jìn)行特征融合操作,得到更新拓?fù)鋱D;
34、第三預(yù)測(cè)子模塊,用于根據(jù)所述拓?fù)涓兄K以及消息傳遞機(jī)制對(duì)所述更新拓?fù)鋱D進(jìn)行質(zhì)量預(yù)測(cè)操作,得到第三原子級(jí)預(yù)測(cè)結(jié)果。
35、為了解決上述技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例還提供一種計(jì)算本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種蛋白質(zhì)模型質(zhì)量評(píng)估方法,其特征在于,包括下述步驟:
2.根據(jù)權(quán)利要求1所述的蛋白質(zhì)模型質(zhì)量評(píng)估方法,其特征在于,所述預(yù)設(shè)算法首先搜索半徑為Pn的原子Pn[i,j]的鄰居,然后,通過(guò)預(yù)設(shè)指數(shù)選擇Pm和Pn中的相鄰原子,并分別計(jì)算所述相鄰原子到Pm[i,j]和Pn[i,j]的各自距離,Pm和Pn中單個(gè)距離之間的差值將通過(guò)映射函數(shù)轉(zhuǎn)換為預(yù)定義的分?jǐn)?shù),最后,通過(guò)對(duì)總鄰數(shù)進(jìn)行歸一化,獲得在原子、殘基和全局水平上的LDDT分?jǐn)?shù)。
3.根據(jù)權(quán)利要求1所述的蛋白質(zhì)模型質(zhì)量評(píng)估方法,其特征在于,所述Atom-ProteinQA模型包括幾何感知模塊,所述將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述Atom-ProteinQA模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果的步驟,具體包括下述步驟:
4.根據(jù)權(quán)利要求1所述的蛋白質(zhì)模型質(zhì)量評(píng)估方法,其特征在于,所述Atom-ProteinQA模型包括拓?fù)涓兄K,所述將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述Atom-ProteinQA模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果的步驟,具體包括下述步驟:
5.根據(jù)權(quán)利要求1所述的蛋白質(zhì)模
6.一種蛋白質(zhì)模型質(zhì)量評(píng)估裝置,其特征在于,包括:
7.根據(jù)權(quán)利要求6所述的蛋白質(zhì)模型質(zhì)量評(píng)估裝置,其特征在于,所述Atom-ProteinQA模型包括幾何感知模塊,所述質(zhì)量評(píng)估模塊包括:
8.根據(jù)權(quán)利要求6所述的蛋白質(zhì)模型質(zhì)量評(píng)估裝置,其特征在于,所述Atom-ProteinQA模型包括拓?fù)涓兄K,所述質(zhì)量評(píng)估模塊包括:
9.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,其特征在于,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)可讀指令,所述處理器執(zhí)行所述計(jì)算機(jī)可讀指令時(shí)實(shí)現(xiàn)如權(quán)利要求1至5中任一項(xiàng)所述的蛋白質(zhì)模型質(zhì)量評(píng)估方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至5中任一項(xiàng)所述的蛋白質(zhì)模型質(zhì)量評(píng)估方法的步驟。
...【技術(shù)特征摘要】
1.一種蛋白質(zhì)模型質(zhì)量評(píng)估方法,其特征在于,包括下述步驟:
2.根據(jù)權(quán)利要求1所述的蛋白質(zhì)模型質(zhì)量評(píng)估方法,其特征在于,所述預(yù)設(shè)算法首先搜索半徑為pn的原子pn[i,j]的鄰居,然后,通過(guò)預(yù)設(shè)指數(shù)選擇pm和pn中的相鄰原子,并分別計(jì)算所述相鄰原子到pm[i,j]和pn[i,j]的各自距離,pm和pn中單個(gè)距離之間的差值將通過(guò)映射函數(shù)轉(zhuǎn)換為預(yù)定義的分?jǐn)?shù),最后,通過(guò)對(duì)總鄰數(shù)進(jìn)行歸一化,獲得在原子、殘基和全局水平上的lddt分?jǐn)?shù)。
3.根據(jù)權(quán)利要求1所述的蛋白質(zhì)模型質(zhì)量評(píng)估方法,其特征在于,所述atom-proteinqa模型包括幾何感知模塊,所述將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述atom-proteinqa模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果的步驟,具體包括下述步驟:
4.根據(jù)權(quán)利要求1所述的蛋白質(zhì)模型質(zhì)量評(píng)估方法,其特征在于,所述atom-proteinqa模型包括拓?fù)涓兄K,所述將所述蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)輸入至所述atom-proteinqa模型進(jìn)行質(zhì)量評(píng)估操作,得到質(zhì)量評(píng)估結(jié)果的步驟,具體包括下述步驟:
5.根據(jù)權(quán)利要求1所述的蛋白質(zhì)模型質(zhì)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李鎮(zhèn),韓亞潼,李煜,周宇喆,王晟,崔曙光,
申請(qǐng)(專利權(quán))人:香港中文大學(xué)深圳,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。