• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種完整糖肽鑒定的方法與系統技術方案

    技術編號:13838119 閱讀:74 留言:0更新日期:2016-10-16 01:00
    本發明專利技術提供一種完整糖肽鑒定的方法,包括:對于任一待鑒定的實測串聯質譜,遍歷糖鏈結構數據庫,對于其中每個糖鏈結構:根據當前串聯譜圖的母離子質量,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量,進而計算匹配到當前二級譜圖的譜峰的數目,并將這個匹配譜峰的數目作為對應情形下的糖肽Y離子與當前二級譜圖匹配的粗打分結果;取粗打分前K名的糖鏈結構作為候選糖鏈結構;對于當前串聯譜圖,遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構進行實測譜和肽段的理論譜的譜譜匹配打分,以及實測譜和糖鏈結構的理論譜的譜譜匹配打分,進而得出糖肽結構鑒定結果。本發明專利技術能夠提高完整糖肽規模化鑒定的可靠性且計算復雜度低。

    【技術實現步驟摘要】

    本專利技術涉及生物信息學
    ,具體地說,本專利技術涉及糖蛋白質組學和質譜

    技術介紹
    質譜技術是規模化鑒定位點特異性的蛋白質糖基化修飾的主要手段。質譜技術中,通常先通過完整糖肽的串聯質譜圖鑒定完整糖肽,然后推斷出蛋白質上的糖基化修飾。目前,針對規模化完整糖肽譜圖的鑒定,存在兩種鑒定策略,分別是①以GRIP、ArMone 2.0等系統為代表的基于完整糖肽串聯譜圖鑒定糖鏈而后根據肽段質量匹配肽段的方法,以及②以Byonic等系統為代表的基于完整糖肽譜圖鑒定肽段而后根據糖鏈質量推測糖鏈組成的方法。下面簡要介紹這兩種方法,然后分析這兩種方法的不足。第①種方法主要是通過糖肽譜圖中的糖鏈碎片離子信息,與糖肽的Y離子匹配后得到糖鏈的鑒定結果,然后再通過推斷出的肽段質量與蛋白質序列庫中的肽段序列進行匹配,推斷出肽段序列。第②種方法主要是通過糖肽譜圖中的肽段碎片離子信息,與糖肽的肽段碎片離子匹配后得到肽段的鑒定結果,然后通過推斷出的糖鏈質量與糖鏈數據庫中糖鏈結構進行匹配,推斷出糖鏈結構。上述兩種方法中,只利用完整糖肽譜圖鑒定糖肽的糖鏈部分或肽段部分,而另一部分則是通過質量直接推斷得到的,因此可靠性較差。舉個例子,當利用完整糖肽譜圖鑒定糖肽的糖鏈部分后,推測出肽段的質量為999.5633,在此誤差范圍內能夠匹配上的質量就很多,例如LTEAKPVDK和DVPKAETLK兩條肽段的質量完全一樣,且都可以匹配上999.5633,如果僅通過質量進行匹配,完全無法區分二者。同理,只根據糖鏈質量推測糖鏈組成的方法也存在上述問題。因此,當前迫切需要一種具有更高可靠性的規模化完整糖肽鑒定解決方案。
    技術實現思路
    本專利技術的任務是提供一種具有更高可靠性的規模化完整糖肽鑒定解決方案。本專利技術提供了一種完整糖肽鑒定的方法,包括下列步驟:1)獲取同時含有糖鏈碎片信息和肽段碎片信息的糖肽二級碎裂的實測串聯質譜;2)對于任一待鑒定的實測串聯質譜,遍歷糖鏈結構數據庫,對于其中每個糖鏈結構,執行步驟21)~22),直至糖鏈結構數據庫中所有糖鏈結構遍歷完畢;21)對于當前糖鏈結構,根據當前串聯譜圖的母離子質量,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量;22)根據步驟21)所得出的每一種情形下的糖肽Y離子的質量,計算匹配到當前二級譜圖的譜峰的數目,并將這個匹配譜峰的數目作為對應情形下的糖肽Y離子與當前二級譜圖匹配的粗打分結果;3)取粗打分結果在前K名的糖鏈結構作為當前串聯譜圖的候選糖鏈結構;其中,K為預設的糖鏈結構的候選數目;4)對于當前串聯譜圖,遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構,進行實測譜和肽段的理論譜的譜譜匹配打分,以及實測譜和糖鏈結構的理論譜的譜譜匹配打分,進而得出糖肽結構鑒定結果。其中,所述步驟21)中,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量的方法包括:計算糖肽Y離子質量=肽段質量+糖鏈還原端離子質量,所述肽段質量由當前串聯譜圖的母離子質量減去當前糖鏈結構的質量得出,所述糖鏈還原端離子質量按下述方法計算得出:分析當前糖鏈結構碎裂的所有可能情形,得到每種可能情形下的碎裂后的糖鏈還原端離子的結構,再基于這些糖鏈還原端離子的結構得出糖鏈還原端離子質量。其中,所述步驟21)中,所述糖鏈還原端離子質量通過查找糖鏈索引表得出,所述糖鏈索引表以質量為索引項,記錄對應于各個質量的糖鏈還原端離子結構。其中,所述步驟21)中,所述糖鏈索引表根據下列子步驟預先得出:211)導入糖鏈結構數據庫并遍歷其中每一個糖鏈結構;212)對于當前糖鏈,基于該糖鏈的結構分析出該糖鏈所有可能的斷裂位置,得出每種斷裂位置對應的還原端離子的結構;213)計算出每一個可能的還原端離子的質量,進而得到所述糖鏈索引表。其中,所述步驟21)還包括:直接舍棄與當前串聯譜圖明顯不匹配的糖鏈結構,如果當前串聯譜圖的二級譜圖中274譜峰強度超過最高峰的10%且當前糖鏈結構中不包含NeuAc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中不包含274譜峰且當前糖鏈結構中包含NeuAc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中290譜峰強度超過最高峰的10%且當前糖鏈結構中不包含NeuGc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中不包含290譜峰且當前糖鏈結構中包含NeuGc,則舍棄該糖鏈結構。其中,所述步驟21)還包括:如果已知待鑒定的糖肽樣品是N糖肽,則根據當前糖鏈結構中五糖核心離子的數目,舍棄明顯不匹配的糖鏈結構。其中,所述步驟4)包括下列子步驟:41)遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構執行步驟42);42)根據當前糖鏈結構和當前串聯譜圖的母離子質量推斷的肽段質量,然后檢索肽段索引表得到該質量匹配的肽段;43)將匹配到的肽段理論碎裂,得到滿足碎裂條件的離子;44)將各個匹配到的肽段的理論碎片離子的理論譜圖與實際的譜圖進行譜譜匹配,得到相應的肽段細打分;45)對于當前候選糖鏈結構,將糖肽的理論Y離子的理論譜圖與實際的譜圖進行譜譜匹配,得到糖鏈結構的細打分;46)糖鏈結構細打分與肽段細打分加權求平均后得到由對應糖鏈結構和對應肽段構成的糖肽的細打分;47)根據各個糖肽結構的細打分得出糖肽結構鑒定結果。其中,所述步驟42)中,所述肽段索引表預先基于蛋白質序列庫建立,所述肽段索引表以質量為索引項記錄對應于各個質量的肽段序列。其中,所述肽段索引表的建立過程包括下列子步驟:421)導入蛋白質序列數據庫并遍歷其中每一個蛋白質序列;422)對于當前蛋白質序列,分析該蛋白質序列所有可能的理論酶切情形,得出每種理論酶切情形對應的肽段序列;423)對于每一條可能的肽段,基于所有可能的修飾形式生成相應的多種帶修飾的肽段;424)計算出每一條可能的肽段的質量,進而得到所述肽段索引表,其中的肽段既包括不帶修飾的肽段,也包括帶修飾的肽段。其中,所述糖鏈索引表的建立過程還包括下列子步驟:214)根據糖鏈結構數據庫中的糖鏈,構造誘餌糖庫,分析誘餌糖鏈的還原端離子結構并計算相應的還原端離子質量;215)將來自誘餌糖鏈的還原端離子的索引項加入步驟33)得到的基于原糖庫生成的糖鏈索引表中;所述肽段索引表的建立過程還包括:425)基于蛋白質序列庫和所有可能的酶切情形,得出包含所有可能肽段的肽段列表,根據肽段列表構造誘餌肽段列表并計算其中每一肽段的肽段質量;426)將誘餌肽段列表并入步驟213)所得的肽段索引表中;所述完整糖肽鑒定方法還包括下列步驟:5)對于每個待鑒定的串聯譜圖,執行步驟2)~4),取每個串聯譜圖糖肽細打分第一名的結果,估計完整糖肽的假發現率,輸出附有假發現率的最終鑒定結果,所述步驟5)包括下列子步驟:51)取每個串聯譜圖第一名的糖肽標記為該譜圖的鑒定結果;52)所有第一名結果中,將糖鏈來自誘餌庫的結果認為是錯誤的糖鏈鑒定,據此估計出其中,代表打分大于等于x的糖鏈鑒定集合的假發現率,IGP代表所有鑒定結果的打分集合,x表示人工設置的打分閾值,G=False代表糖鏈鑒定錯誤的事件,p代表概率函數;53)所有第一名結果中,將肽段來自誘餌庫的結果認為是錯誤的肽段鑒定,根據錯誤的肽段鑒定數目,計算出其中,代表打分大于等于x的肽段鑒定集合的假發現率,IGP代表所有鑒定結果的打分集合,x本文檔來自技高網
    ...

    【技術保護點】
    一種完整糖肽鑒定的方法,包括下列步驟:1)獲取同時含有糖鏈碎片信息和肽段碎片信息的糖肽二級碎裂的實測串聯質譜;2)對于任一待鑒定的實測串聯質譜,遍歷糖鏈結構數據庫,對于其中每個糖鏈結構,執行步驟21)~22),直至糖鏈結構數據庫中所有糖鏈結構遍歷完畢;21)對于當前糖鏈結構,根據當前串聯譜圖的母離子質量,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量;22)根據步驟21)所得出的每一種情形下的糖肽Y離子的質量,計算匹配到當前二級譜圖的譜峰的數目,并將這個匹配譜峰的數目作為對應情形下的糖肽Y離子與當前二級譜圖匹配的粗打分結果;3)取粗打分結果在前K名的糖鏈結構作為當前串聯譜圖的候選糖鏈結構;其中,K為預設的糖鏈結構的候選數目;4)對于當前串聯譜圖,遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構,進行實測譜和肽段的理論譜的譜譜匹配打分,以及實測譜和糖鏈結構的理論譜的譜譜匹配打分,進而得出糖肽結構鑒定結果。

    【技術特征摘要】
    1.一種完整糖肽鑒定的方法,包括下列步驟:1)獲取同時含有糖鏈碎片信息和肽段碎片信息的糖肽二級碎裂的實測串聯質譜;2)對于任一待鑒定的實測串聯質譜,遍歷糖鏈結構數據庫,對于其中每個糖鏈結構,執行步驟21)~22),直至糖鏈結構數據庫中所有糖鏈結構遍歷完畢;21)對于當前糖鏈結構,根據當前串聯譜圖的母離子質量,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量;22)根據步驟21)所得出的每一種情形下的糖肽Y離子的質量,計算匹配到當前二級譜圖的譜峰的數目,并將這個匹配譜峰的數目作為對應情形下的糖肽Y離子與當前二級譜圖匹配的粗打分結果;3)取粗打分結果在前K名的糖鏈結構作為當前串聯譜圖的候選糖鏈結構;其中,K為預設的糖鏈結構的候選數目;4)對于當前串聯譜圖,遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構,進行實測譜和肽段的理論譜的譜譜匹配打分,以及實測譜和糖鏈結構的理論譜的譜譜匹配打分,進而得出糖肽結構鑒定結果。2.根據權利要求1所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)中,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量的方法包括:計算糖肽Y離子質量=肽段質量+糖鏈還原端離子質量,所述肽段質量由當前串聯譜圖的母離子質量減去當前糖鏈結構的質量得出,所述糖鏈還原端離子質量按下述方法計算得出:分析當前糖鏈結構碎裂的所有可能情形,得到每種可能情形下的碎裂后的糖鏈還原端離子的結構,再基于這些糖鏈還原端離子的結構得出糖鏈還原端離子質量。3.根據權利要求2所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)中,所述糖鏈還原端離子質量通過查找糖鏈索引表得出,所述糖鏈索引表以質量為索引項,記錄對應于各個質量的糖鏈還原端離子結構。4.根據權利要求3所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)中,所述糖鏈索引表根據下列子步驟預先得出:211)導入糖鏈結構數據庫并遍歷其中每一個糖鏈結構;212)對于當前糖鏈,基于該糖鏈的結構分析出該糖鏈所有可能的斷裂位置,得出每種斷裂位置對應的還原端離子的結構;213)計算出每一個可能的還原端離子的質量,進而得到所述糖鏈索引表。5.根據權利要求3所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)還包括:直接舍棄與當前串聯譜圖明顯不匹配的糖鏈結構,如果當前串聯譜圖的二級譜圖中274譜峰強度超過最高峰的10%且當前糖鏈結構中不包含NeuAc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中不包含274譜峰且當前糖鏈結構中包含NeuAc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中290譜峰強度超過最高峰的10%且當前糖鏈結構中不包含NeuGc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中不包含290譜峰且當前糖鏈結構中包含NeuGc,則舍棄該糖鏈結構。6.根據權利要求3所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)還包括:如果已知待鑒定的糖肽樣品是N糖肽,則根據當前糖鏈結構中五糖核心離子的數目,舍棄明顯不匹配的糖鏈結構。7.根據權利要求4所述的完整糖肽鑒定的方法,其特征在于,所述步驟4)包括下列子步驟:41)遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構執行步驟42);42)...

    【專利技術屬性】
    技術研發人員:曾文鋒劉銘琪張曉今吳建強張揚孫瑞祥楊芃原賀思敏
    申請(專利權)人:中國科學院計算技術研究所
    類型:發明
    國別省市:北京;11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码人妻精品一区二| 久久青青草原亚洲av无码| 亚洲级αV无码毛片久久精品| 18禁无遮挡无码网站免费| 无码人妻丰满熟妇啪啪| 无码国产精成人午夜视频一区二区| 成人无码Av片在线观看| 久久av高潮av无码av喷吹| 免费A级毛片无码视频| 亚洲av无码不卡私人影院| 日韩免费a级毛片无码a∨| 国产精品无码无需播放器| 日韩精品无码Av一区二区| 无码人妻一区二区三区免费手机| 国产精品成人无码久久久久久 | 亚洲中文字幕无码中文字在线| 无码精品A∨在线观看| 久久久久无码国产精品不卡 | 国产免费久久久久久无码| 中文无码精品A∨在线观看不卡| 中文字幕乱码人妻无码久久| 无码国模国产在线无码精品国产自在久国产 | 在线看片无码永久免费aⅴ| 久久亚洲精品成人无码网站| 国产精品无码专区| 亚洲AV无码专区日韩| 无码视频一区二区三区| 日韩av无码成人无码免费| 亚洲Av永久无码精品黑人| 精品久久亚洲中文无码| 久久久久亚洲Av片无码v| 亚洲AV无码专区亚洲AV伊甸园 | 无码无套少妇毛多18PXXXX| 精品无码一区二区三区爱欲九九| 久久久亚洲精品无码| 久久久无码精品亚洲日韩蜜桃| 国产av无码专区亚洲av桃花庵| 亚洲中文久久精品无码ww16| 成人无码a级毛片免费| 中文无码vs无码人妻 | 无码日本电影一区二区网站|