【技術實現步驟摘要】
本專利技術涉及生物信息學
,具體地說,本專利技術涉及糖蛋白質組學和質譜
技術介紹
質譜技術是規模化鑒定位點特異性的蛋白質糖基化修飾的主要手段。質譜技術中,通常先通過完整糖肽的串聯質譜圖鑒定完整糖肽,然后推斷出蛋白質上的糖基化修飾。目前,針對規模化完整糖肽譜圖的鑒定,存在兩種鑒定策略,分別是①以GRIP、ArMone 2.0等系統為代表的基于完整糖肽串聯譜圖鑒定糖鏈而后根據肽段質量匹配肽段的方法,以及②以Byonic等系統為代表的基于完整糖肽譜圖鑒定肽段而后根據糖鏈質量推測糖鏈組成的方法。下面簡要介紹這兩種方法,然后分析這兩種方法的不足。第①種方法主要是通過糖肽譜圖中的糖鏈碎片離子信息,與糖肽的Y離子匹配后得到糖鏈的鑒定結果,然后再通過推斷出的肽段質量與蛋白質序列庫中的肽段序列進行匹配,推斷出肽段序列。第②種方法主要是通過糖肽譜圖中的肽段碎片離子信息,與糖肽的肽段碎片離子匹配后得到肽段的鑒定結果,然后通過推斷出的糖鏈質量與糖鏈數據庫中糖鏈結構進行匹配,推斷出糖鏈結構。上述兩種方法中,只利用完整糖肽譜圖鑒定糖肽的糖鏈部分或肽段部分,而另一部分則是通過質量直接推斷得到的,因此可靠性較差。舉個例子,當利用完整糖肽譜圖鑒定糖肽的糖鏈部分后,推測出肽段的質量為999.5633,在此誤差范圍內能夠匹配上的質量就很多,例如LTEAKPVDK和DVPKAETLK兩條肽段的質量完全一樣,且都可以匹配上999.5633,如果僅通過質量進行匹配,完全無法區分二者。同理,只根據糖鏈質量推測糖鏈組成的方法也存在上述問題。因此,當前迫切需要一種具有更高可靠性的規模化完 ...
【技術保護點】
一種完整糖肽鑒定的方法,包括下列步驟:1)獲取同時含有糖鏈碎片信息和肽段碎片信息的糖肽二級碎裂的實測串聯質譜;2)對于任一待鑒定的實測串聯質譜,遍歷糖鏈結構數據庫,對于其中每個糖鏈結構,執行步驟21)~22),直至糖鏈結構數據庫中所有糖鏈結構遍歷完畢;21)對于當前糖鏈結構,根據當前串聯譜圖的母離子質量,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量;22)根據步驟21)所得出的每一種情形下的糖肽Y離子的質量,計算匹配到當前二級譜圖的譜峰的數目,并將這個匹配譜峰的數目作為對應情形下的糖肽Y離子與當前二級譜圖匹配的粗打分結果;3)取粗打分結果在前K名的糖鏈結構作為當前串聯譜圖的候選糖鏈結構;其中,K為預設的糖鏈結構的候選數目;4)對于當前串聯譜圖,遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構,進行實測譜和肽段的理論譜的譜譜匹配打分,以及實測譜和糖鏈結構的理論譜的譜譜匹配打分,進而得出糖肽結構鑒定結果。
【技術特征摘要】
1.一種完整糖肽鑒定的方法,包括下列步驟:1)獲取同時含有糖鏈碎片信息和肽段碎片信息的糖肽二級碎裂的實測串聯質譜;2)對于任一待鑒定的實測串聯質譜,遍歷糖鏈結構數據庫,對于其中每個糖鏈結構,執行步驟21)~22),直至糖鏈結構數據庫中所有糖鏈結構遍歷完畢;21)對于當前糖鏈結構,根據當前串聯譜圖的母離子質量,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量;22)根據步驟21)所得出的每一種情形下的糖肽Y離子的質量,計算匹配到當前二級譜圖的譜峰的數目,并將這個匹配譜峰的數目作為對應情形下的糖肽Y離子與當前二級譜圖匹配的粗打分結果;3)取粗打分結果在前K名的糖鏈結構作為當前串聯譜圖的候選糖鏈結構;其中,K為預設的糖鏈結構的候選數目;4)對于當前串聯譜圖,遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構,進行實測譜和肽段的理論譜的譜譜匹配打分,以及實測譜和糖鏈結構的理論譜的譜譜匹配打分,進而得出糖肽結構鑒定結果。2.根據權利要求1所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)中,推斷出碎裂測試中所有可能獲得的糖肽Y離子的質量的方法包括:計算糖肽Y離子質量=肽段質量+糖鏈還原端離子質量,所述肽段質量由當前串聯譜圖的母離子質量減去當前糖鏈結構的質量得出,所述糖鏈還原端離子質量按下述方法計算得出:分析當前糖鏈結構碎裂的所有可能情形,得到每種可能情形下的碎裂后的糖鏈還原端離子的結構,再基于這些糖鏈還原端離子的結構得出糖鏈還原端離子質量。3.根據權利要求2所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)中,所述糖鏈還原端離子質量通過查找糖鏈索引表得出,所述糖鏈索引表以質量為索引項,記錄對應于各個質量的糖鏈還原端離子結構。4.根據權利要求3所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)中,所述糖鏈索引表根據下列子步驟預先得出:211)導入糖鏈結構數據庫并遍歷其中每一個糖鏈結構;212)對于當前糖鏈,基于該糖鏈的結構分析出該糖鏈所有可能的斷裂位置,得出每種斷裂位置對應的還原端離子的結構;213)計算出每一個可能的還原端離子的質量,進而得到所述糖鏈索引表。5.根據權利要求3所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)還包括:直接舍棄與當前串聯譜圖明顯不匹配的糖鏈結構,如果當前串聯譜圖的二級譜圖中274譜峰強度超過最高峰的10%且當前糖鏈結構中不包含NeuAc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中不包含274譜峰且當前糖鏈結構中包含NeuAc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中290譜峰強度超過最高峰的10%且當前糖鏈結構中不包含NeuGc,則舍棄該糖鏈結構;如果當前串聯譜圖的二級譜圖中不包含290譜峰且當前糖鏈結構中包含NeuGc,則舍棄該糖鏈結構。6.根據權利要求3所述的完整糖肽鑒定的方法,其特征在于,所述步驟21)還包括:如果已知待鑒定的糖肽樣品是N糖肽,則根據當前糖鏈結構中五糖核心離子的數目,舍棄明顯不匹配的糖鏈結構。7.根據權利要求4所述的完整糖肽鑒定的方法,其特征在于,所述步驟4)包括下列子步驟:41)遍歷所有的候選糖鏈結構,對于每一候選糖鏈結構執行步驟42);42)...
【專利技術屬性】
技術研發人員:曾文鋒,劉銘琪,張曉今,吳建強,張揚,孫瑞祥,楊芃原,賀思敏,
申請(專利權)人:中國科學院計算技術研究所,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。