• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當(dāng)前位置: 首頁 > 專利查詢>同濟(jì)大學(xué)專利>正文

    一種生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法技術(shù)

    技術(shù)編號:11723868 閱讀:108 留言:0更新日期:2015-07-11 15:32
    本發(fā)明專利技術(shù)涉及一種生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法,本搜索方法基于所述質(zhì)譜的原始一級質(zhì)譜和候選生物大分子,靶向在線計(jì)算與動(dòng)態(tài)存儲(chǔ)二級質(zhì)譜數(shù)據(jù)庫。與現(xiàn)有技術(shù)相比,本發(fā)明專利技術(shù)的方法對高通量的質(zhì)譜解析效率有著顯著的提升,可以避免大量不必要數(shù)據(jù)計(jì)算任務(wù),大幅減少搜索所需的時(shí)間和硬盤存儲(chǔ)空間,適用于高通量的大數(shù)據(jù)的解析,特別是生物大分子(如蛋白質(zhì),糖類)質(zhì)譜及串級質(zhì)譜高效解析及結(jié)構(gòu)準(zhǔn)確鑒定。

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    一種生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法
    本專利技術(shù)涉及一種生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法,主要涉及與生物質(zhì)譜相關(guān)的系統(tǒng)生物學(xué)領(lǐng)域,包括蛋白質(zhì)組學(xué)、糖組學(xué)等

    技術(shù)介紹
    隨著軟電離技術(shù)(如電噴霧電離)及高分辨質(zhì)量分析器(如軌道阱)的發(fā)展和商業(yè)化,質(zhì)譜越來越多地用于生物大分子(如蛋白質(zhì)、多糖)的分析。中國專利CN103389335A公布了一種通過分析生物大分子質(zhì)譜數(shù)據(jù)來鑒定生物大分子一級結(jié)構(gòu)和組成的分析裝置和方法。該分析裝置和方法基于所述生物大分子的原始一級和二級質(zhì)譜,通過同位素峰質(zhì)荷比及輪廓指紋比對從而對該生物大分子進(jìn)行鑒定。上述分析裝置和方法直接利用質(zhì)譜儀所采集的原始實(shí)驗(yàn)質(zhì)譜數(shù)據(jù),對前體離子和碎片離子同位素輪廓中每個(gè)原始實(shí)驗(yàn)同位素峰的精確質(zhì)荷比和相對強(qiáng)度與相應(yīng)的理論值進(jìn)行比對,分別用于從數(shù)據(jù)庫中找到候選生物大分子和利用串級質(zhì)譜確認(rèn)其中可信度最高的一個(gè),從而對生物分子進(jìn)行高可信度的定性、定量分析。在生物信息學(xué)技術(shù)方面,與肽段的質(zhì)譜鑒定方法相似,完整蛋白質(zhì)的鑒定同樣也是主要采用數(shù)據(jù)庫搜索的方法。在蛋白質(zhì)鑒定中,我們需要考慮蛋白質(zhì)不同的變體形式(包括修飾、氨基酸突變等),如何根據(jù)蛋白質(zhì)的序列生成的候選變體數(shù)據(jù)庫成為搜索的一個(gè)難題,種類多,計(jì)算量大。對于完整的蛋白質(zhì),發(fā)生修飾等變化的位點(diǎn)數(shù)目可能要多很多,這樣,我們?nèi)菰S一個(gè)蛋白質(zhì)序列上的可變修飾位點(diǎn)數(shù)就會(huì)增加,當(dāng)可變修飾位點(diǎn)數(shù)增加到10個(gè)以上時(shí),再考慮到每個(gè)位點(diǎn)上可能修飾類型的不同,組合起來容易產(chǎn)生數(shù)量巨大的蛋白質(zhì)變體形式,就可能出現(xiàn)指數(shù)爆炸的情況。而且,若再考慮氨基酸突變等組合形式,蛋白質(zhì)變體形式將再指數(shù)增長,這也是現(xiàn)有處理方法的一個(gè)主要瓶頸。由于蛋白質(zhì)變體的數(shù)量巨大,傳統(tǒng)基于數(shù)據(jù)庫的蛋白質(zhì)搜索引擎的方法需要在搜索之前對所有的蛋白質(zhì)變體的理論一級譜和二級譜進(jìn)行計(jì)算和存儲(chǔ),既要花費(fèi)大量的時(shí)間,又要占用大量的硬盤存儲(chǔ)空間。數(shù)據(jù)庫中,大量的理論的二級質(zhì)譜數(shù)據(jù)在搜索過程并未被使用,屬于不必要計(jì)算。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種避免大量不必要數(shù)據(jù)計(jì)算任務(wù)、平均計(jì)算量小、高效高通量的生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法。本專利技術(shù)的目的可以通過以下技術(shù)方案來實(shí)現(xiàn):一種生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法,包括以下步驟:(1)根據(jù)標(biāo)準(zhǔn)生物大分子數(shù)據(jù)庫中的序列與修飾信息,分別生成所有對應(yīng)生物大分子變體的理論一級質(zhì)譜數(shù)據(jù)庫;(2)將生物大分子實(shí)驗(yàn)的一級質(zhì)譜與理論的一級質(zhì)譜相比較,找出所有與該一級質(zhì)譜對應(yīng)的候選生物大分子變體;(3)確定數(shù)據(jù)庫中是否有以上所有候選生物大分子變體的二級質(zhì)譜數(shù)據(jù),若無,則靶向地在線計(jì)算該生物大分子的理論二級質(zhì)譜數(shù)據(jù),并將其存放于數(shù)據(jù)庫中,若有,則直接進(jìn)行下一步的匹配;(4)將生物大分子實(shí)驗(yàn)的二級質(zhì)譜數(shù)據(jù)與候選生物大分子變體的理論的二級質(zhì)譜相比較,進(jìn)行匹配;(5)循環(huán)以上(2)-(4)步驟,直到確定所有二級質(zhì)譜對應(yīng)的生物大分子。指生物大分子實(shí)驗(yàn)的二級質(zhì)譜數(shù)據(jù)與候選生物大分子變體的理論的二級質(zhì)譜相似度達(dá)到指定要求。步驟(1)中生成所有對應(yīng)生物大分子變體的理論一級質(zhì)譜數(shù)據(jù)庫的方法為:根據(jù)對應(yīng)生物大分子變體的序列、修飾等信息,計(jì)算出對應(yīng)前體離子的分子式,并根據(jù)該分子式計(jì)算出與實(shí)驗(yàn)一級質(zhì)譜對應(yīng)的單同位素質(zhì)量或同位素輪廓,該方法為常規(guī)處理方法,在此不作詳細(xì)闡述。步驟(3)中靶向地在線計(jì)算該生物大分子的理論二級質(zhì)譜數(shù)據(jù)的計(jì)算方法為:模擬質(zhì)譜儀中二級質(zhì)譜的特征,將該生物大分子進(jìn)行碎裂,計(jì)算出所有理論的碎片離子的分子式,并根據(jù)該分子式計(jì)算出與實(shí)驗(yàn)二級質(zhì)譜對應(yīng)的單同位素質(zhì)量或同位素輪廓,該方法為常規(guī)處理方法,在此不作詳細(xì)闡述。步驟(3)中,所有理論的二級質(zhì)譜數(shù)據(jù)都是在搜索的過程中在線計(jì)算與動(dòng)態(tài)存儲(chǔ)的,判斷是否計(jì)算某一生物大分子變體理論二級質(zhì)譜的條件是:(1)該生物大分子變體是實(shí)驗(yàn)的一級質(zhì)譜與理論的一級質(zhì)譜匹配得到的候選生物大分子變體;(2)使用的數(shù)據(jù)庫中不包含該生物大分子變體的二級質(zhì)譜數(shù)據(jù)。所述的生物大分子為蛋白質(zhì)、核酸、糖或碳?xì)浠衔铩1緦@夹g(shù)涉及的方法同樣適用于其他質(zhì)譜以及任何需要預(yù)先建立數(shù)據(jù)庫的數(shù)據(jù)庫搜索。本專利技術(shù)搜索方法基于所述質(zhì)譜的原始一級和二級質(zhì)譜的數(shù)據(jù)庫搜索策略,通過靶向在線計(jì)算的方式生成與存儲(chǔ)二級質(zhì)譜數(shù)據(jù)庫。所有需要計(jì)算的理論二級質(zhì)譜數(shù)據(jù)都是在本次的搜索過程中必需使用到的,從而避免了大量不必要數(shù)據(jù)的計(jì)算任務(wù)與存儲(chǔ)。而且,該數(shù)據(jù)庫具備可完善性,即通常一個(gè)體系的數(shù)據(jù)庫是可以反復(fù)使用的,每一次的使用都可能有新的理論二級質(zhì)譜被計(jì)算并添加進(jìn)該數(shù)據(jù)庫中,起到不斷完善數(shù)據(jù)庫的作用。與現(xiàn)有技術(shù)相比,本專利技術(shù)的解析方法對高通量的質(zhì)譜解析效率有著顯著的提升,可以大幅減少搜索所需的時(shí)間和硬盤存儲(chǔ)空間,適用于高通量的大數(shù)據(jù)的解析,特別是生物大分子(如蛋白質(zhì),糖類)質(zhì)譜及串級質(zhì)譜高效解析及結(jié)構(gòu)準(zhǔn)確鑒定。具體實(shí)施方式下面結(jié)合具體實(shí)施例對本專利技術(shù)進(jìn)行詳細(xì)說明。實(shí)施例一種蛋白質(zhì)質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法,包括以下步驟:(1)根據(jù)標(biāo)準(zhǔn)蛋白質(zhì)序列數(shù)據(jù)庫中的序列與修飾信息,分別生成所有對應(yīng)蛋白變體的理論一級質(zhì)譜數(shù)據(jù)庫。(2)將實(shí)驗(yàn)的一級質(zhì)譜與理論的一級質(zhì)譜相比較,找出所有與該一級質(zhì)譜對應(yīng)的候選蛋白質(zhì)變體。(3)首先確定數(shù)據(jù)庫中是否有以上所有候選蛋白質(zhì)的二級質(zhì)譜數(shù)據(jù),若無,則靶向地在線計(jì)算該蛋白的理論二級質(zhì)譜數(shù)據(jù),并將其存放于數(shù)據(jù)庫中,若有,則直接進(jìn)行下一步的匹配。(4)將實(shí)驗(yàn)的二級質(zhì)譜數(shù)據(jù)與候選蛋白質(zhì)的理論的二級質(zhì)譜相比較,進(jìn)行匹配;(5)循環(huán)以上(2)-(4)步驟,直到確定所有二級質(zhì)譜對應(yīng)的生物大分子。步驟(3)中,所有理論的二級質(zhì)譜數(shù)據(jù)都是在搜索的過程中在線計(jì)算與動(dòng)態(tài)存儲(chǔ),判斷是否計(jì)算某一蛋白質(zhì)變體理論二級質(zhì)譜的條件是:(1)該蛋白質(zhì)變體是實(shí)驗(yàn)的一級質(zhì)譜與理論的一級質(zhì)譜匹配得到的候選蛋白質(zhì);(2)使用的數(shù)據(jù)庫中不包含該蛋白質(zhì)變體的二級質(zhì)譜數(shù)據(jù)。以大腸桿菌為例,從UniProt蛋白質(zhì)數(shù)據(jù)庫(www.uniprot.org)獲得的大腸桿菌的中氨基酸序列長度為1-200的所有序列信息,通過對不同修飾的組合,共得到2883種理論蛋白質(zhì)變體,采用傳統(tǒng)方法需要計(jì)算2883種蛋白質(zhì)變體的理論一級質(zhì)譜及二級質(zhì)譜。在對一個(gè)用反相色譜-串級質(zhì)譜分析大腸桿菌整體蛋白質(zhì)組得到的數(shù)據(jù)組中第1500-20000個(gè)質(zhì)譜圖進(jìn)行搜索時(shí),實(shí)驗(yàn)一級質(zhì)譜與理論的一級質(zhì)譜匹配得到的候選蛋白質(zhì)變體共有840種。采用本專利技術(shù)方法后只需計(jì)算840(相對于2883)種蛋白變體的理論二級譜,計(jì)算量相比減少70.9%。人類蛋白質(zhì)按氨基酸序列有20000多個(gè),如果考慮修飾和氨基酸突變,其整體蛋白質(zhì)變體的數(shù)量至少在百萬數(shù)量級;對如此大數(shù)據(jù)庫進(jìn)行分析時(shí),本專利技術(shù)方法將大大提高分析的通量。上述的對實(shí)施例的描述是為便于該
    的普通技術(shù)人員能理解和使用專利技術(shù)。熟悉本領(lǐng)域技術(shù)的人員顯然可以容易地對這些實(shí)施例做出各種修改,并把在此說明的一般原理應(yīng)用到其他實(shí)施例中而不必經(jīng)過創(chuàng)造性的勞動(dòng)。因此,本專利技術(shù)不限于上述實(shí)施例,本領(lǐng)域技術(shù)人員根據(jù)本專利技術(shù)的揭示,不脫離本專利技術(shù)范疇所做出的改進(jìn)和修改都應(yīng)該在本專利技術(shù)的保護(hù)范圍之內(nèi)。本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】
    一種生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法,其特征在于,包括以下步驟:(1)根據(jù)標(biāo)準(zhǔn)生物大分子數(shù)據(jù)庫中的序列與修飾信息,分別生成所有對應(yīng)生物大分子變體的理論一級質(zhì)譜數(shù)據(jù)庫;(2)將生物大分子實(shí)驗(yàn)的一級質(zhì)譜與理論的一級質(zhì)譜相比較,找出所有與該一級質(zhì)譜對應(yīng)的候選生物大分子變體;(3)確定數(shù)據(jù)庫中是否有以上所有候選生物大分子變體的二級質(zhì)譜數(shù)據(jù),若無,則靶向地在線計(jì)算該生物大分子的理論二級質(zhì)譜數(shù)據(jù),并將其存放于數(shù)據(jù)庫中,若有,則直接進(jìn)行下一步的匹配;(4)將生物大分子實(shí)驗(yàn)的二級質(zhì)譜數(shù)據(jù)與候選生物大分子變體的理論的二級質(zhì)譜相比較,進(jìn)行匹配;(5)循環(huán)以上(2)?(4)步驟,直到確定所有二級質(zhì)譜對應(yīng)的生物大分子。

    【技術(shù)特征摘要】
    1.一種生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法,其特征在于,包括以下步驟:(1)根據(jù)標(biāo)準(zhǔn)生物大分子數(shù)據(jù)庫中的序列與修飾信息,分別生成所有對應(yīng)生物大分子變體的理論一級質(zhì)譜數(shù)據(jù)庫;(2)將生物大分子的實(shí)驗(yàn)一級質(zhì)譜與理論一級質(zhì)譜相比較,找出所有與實(shí)驗(yàn)一級質(zhì)譜對應(yīng)的候選生物大分子變體;(3)確定數(shù)據(jù)庫中是否有以上所有候選生物大分子變體的二級質(zhì)譜數(shù)據(jù),若無,則靶向地在線計(jì)算該生物大分子的理論二級質(zhì)譜數(shù)據(jù),并將其存放于數(shù)據(jù)庫中,若有,則直接進(jìn)行下一步的匹配;(4)將生物大分子實(shí)驗(yàn)的二級質(zhì)譜數(shù)據(jù)與候選生物大分子變體的理論的二級質(zhì)譜相比較,進(jìn)行匹配;(5)循環(huán)以上(2)-(4)步驟,直到確定所有二級質(zhì)譜對應(yīng)的生物大分子。2.根據(jù)權(quán)利要求1所述的一種生物質(zhì)譜數(shù)據(jù)庫快速建立與搜索的方法,其特征在于,步驟(1)中生成所有對應(yīng)生物大分子變體的理論一級質(zhì)譜數(shù)據(jù)庫的方法為:根據(jù)對應(yīng)生物大分子變體的序列、修飾信息,計(jì)算出對應(yīng)前體離子的分子式,并根據(jù)...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:肖開捷田志新
    申請(專利權(quán))人:同濟(jì)大學(xué)
    類型:發(fā)明
    國別省市:上海;31

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 潮喷大喷水系列无码久久精品| 国产a v无码专区亚洲av| 国产白丝无码免费视频| 无码精品A∨在线观看中文| 无码AV片在线观看免费| 国产精品无码一二区免费| 一区二区三区人妻无码 | 日韩人妻无码精品无码中文字幕| 中文无码AV一区二区三区| 亚洲AV成人无码天堂| 国产成人无码免费看片软件| 亚洲乱人伦中文字幕无码| 无码日韩精品一区二区免费暖暖| 四虎成人精品无码永久在线| 中文字幕人成无码人妻综合社区| 国产成人无码区免费内射一片色欲| 亚洲a∨无码精品色午夜| 久久午夜无码鲁丝片| 亚洲AV无码专区在线播放中文| 无码无套少妇毛多69XXX| 一本色道久久综合无码人妻| 亚洲熟妇无码爱v在线观看| 国产V亚洲V天堂A无码| 亚洲日韩v无码中文字幕| 亚洲精品一级无码中文字幕| 四虎成人精品无码永久在线| 精品少妇人妻AV无码专区不卡| 亚洲午夜无码久久久久小说| 精品久久久无码21p发布| 亚洲AV无码一区二区三区在线| 无码人妻丰满熟妇区免费| 亚洲va中文字幕无码久久不卡 | 免费无码看av的网站| 久久亚洲精品无码av| 国产成人无码网站| 亚洲一级Av无码毛片久久精品| 本道久久综合无码中文字幕| 国内精品久久人妻无码不卡| 国产成人无码免费视频97| 黑人无码精品又粗又大又长| 国产乱子伦精品无码专区|