一種高度自定義化的天然產物排重和注釋方法技術

技術編號：44489800 閱讀：3 留言：0更新日期：2025-03-04 17:54

一種高度自定義化的天然產物排重和注釋方法，包括：1:使用不同發酵條件對目標菌株進行發酵,并對發酵液進行高分辨液質聯用非靶向模式進行數據采集；2:對采集所得的原始數據進行處理,獲得僅在菌株發酵液中出現的信號特征列表；3:對獲得的信號特征列表進行MNA分析,獲得注釋和聚類結果。本發明專利技術提高了高通量質譜數據的注釋效率,能夠避免了天然產物發現過程中的耗時耗力的重復勞動,進而提高新穎活性天然產物的發現效率。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及一種高度自定義化的天然產物排重和注釋方法molecularnetworkingannotation(mna),屬于天然產物化學領域。

技術介紹

1、活性天然產物的發現過程中，高效液相色譜和質譜聯用常常能對復雜樣本提供豐富的信息，但是液相-質譜聯用非靶向采集模式下高通量獲得的大批二級質譜數據。如何對獲得的海量數據進行有效的注釋和排重,是獲得新天然產物的關鍵。

技術實現思路

1、針對上述情況,為克服現有技術的缺點和不足,本專利技術提供一種高度自定義化的天然產物排重和注釋方法。

2、本專利技術基于高分辨液質聯用的快速排重和注釋策略,以不同培養基發酵條件下的菌株發酵液為例,通過采集發酵液、空白培養基的多級質譜,采用多級質譜比較獲得數據庫注釋結果及樣本內聚類情況,優選出樣本中的新穎天然產物,實現對高通量質譜數據的快速注釋和排重。

3、本專利技術的目的是通過以下技術方案來實現的:

4、一種高度自定義化的天然產物排重和注釋方法,具體為:

5、s1.使用多種培養基對目標菌株進行發酵,得到不同的發酵液,同時使用相同培養基作為空白對照；

6、s2.對菌株的多種發酵液和空培養基進行處理后,使用非數據依賴的質譜采集模式采集一級高分辨質譜信號及其二級質譜信號,獲得質譜原始數據,預先處理成便于操作的開放數據格式文件,對開放數據格式文件進行操作,主要步驟有特征提取、離子流構建、特征對齊并扣除空白培養基信號,最后篩選出僅出現在目標菌株發酵液

7、s3.對篩選后的質譜信號特征為對象進行分析,首先將這些特征與數據庫進行比對:先一級質譜比對,根據設定閾值,對高于閾值的進行二級質譜比對,根據設定閾值保留注釋結果,然后對篩選后的信號進行二級質譜比對,根據設定閾值進行聚類,劃分成簇和單點,最后得到聚類和注釋結果。

8、進一步地,步驟s2所述的對采集到的一級及其二級高分辨質譜信號原始數據處理成開放數據格式,并經過特征提取、離子流構建、特征對齊并扣除空白培養基,最后篩選出僅在目標菌株發酵液中出現的信號特征列表,并作為mna的輸出,具體為:

9、s21.使用軟件將獲得的質譜原始文件轉換成開放數據格式；

10、s22.使用軟件處理開放數據格式質譜文件,按照指定閾值提取一級質譜信號,按照指定閾值提取二級質譜信號,按照指定參數構建離子流,按照指定進行特征對齊并扣除空白培養基信號,最后輸出僅在目標菌株發酵液中出現的信號特征列表。

11、進一步地,步驟s3所述的將篩選后的質譜信號特征與數據庫進行比對:先一級質譜比對,根據設定閾值,對高于閾值的進行二級質譜比對,根據設定閾值保留注釋結果；繼續對篩選后的信號進行二級質譜比對,根據設定閾值進行聚類,劃分成簇和單點,最后得到聚類和注釋結果,具體為:

12、s31.基于給定誤差范圍,以所有目標菌株發酵液中出現的信號列表特征為對象,將其中所有的一級質譜與數據庫進行比較,保留誤差范圍內的匹配結果；

13、s32.根據保留的誤差范圍內的一級質譜匹配結果,進一步比較二級質譜,基于相似度閾值,保留注釋結果；

14、s33.將目標菌株發酵液中出現的所有信號特征的二級質譜進行兩兩比對,根據給定閾值,將特征劃分成簇或單點。

15、進一步地,本專利技術還包括：s4根據目標菌株產物信號中保留的信號分子的注釋和聚類情況,獲得可進行進一步分離純化的產物信號。

16、本專利技術采取了多種發酵條件,最大程度激發了菌株代謝天然產物的效率；通過多級質譜的分級比較策略,先通過一級質譜比對縮小候選范圍,再使用時間復雜程度更高的二級質譜比對,大大提高了比對效率；通過二級質譜比對對樣本內質譜特征進行劃分聚類,能夠有效擴展注釋信息,增強排重效果。此外,目前最通用的天然產物注釋流程,具有可選參數少,質譜比對方法單一的缺點。但液質聯用的數據收到實驗樣品、質譜儀器等較多因素影響,產生的質譜數據各不相同,因此選擇合適的比對參數和比對方法尤為重要。本專利技術涉及一種高度自定義化的天然產物排重和注釋算法,提供了多種參數及質譜比對算法的選擇,支持各參數及方法的快速調整。綜上,全新的高分辨液質聯用數據解讀策略對從高通量數據中挖掘新穎天然產物而言具有重要意義。

17、本專利技術的優點是：提高了高通量質譜數據的注釋效率,能夠避免了天然產物發現過程中的耗時耗力的重復勞動,進而提高新穎活性天然產物的發現效率。

本文檔來自技高網...

【技術保護點】

1.一種高度自定義化的天然產物排重和注釋方法，其特征在于，包括如下步驟：

2.根據權利要求1所述的方法,其特征在于,步驟S2所述對采集到的一級及其二級高分辨質譜信號原始數據處理成開放數據格式,并經過特征提取、離子流構建、特征對齊并扣除空白培養基,最后篩選出僅在目標菌株發酵液中出現的信號特征列表,并作為MNA的輸出,具體為:

3.根據權利要求1所述的方法,其特征在于,步驟S3所述的篩選后的質譜信號特征與數據庫進行比對:先一級質譜比對,根據設定閾值,對高于閾值的進行二級質譜比對,根據設定閾值保留注釋結果；繼續對篩選后的信號進行二級質譜比對,根據設定閾值進行聚類,劃分成簇和單點,最后得到聚類和注釋結果,具體為:

4.根據權利要求1所述方法,其特征在于,還包括:步驟S4根據目標菌株產物信號中保留的信號分子的注釋和聚類情況,獲得可進行進一步分離純化的產物信號。

【技術特征摘要】

1.一種高度自定義化的天然產物排重和注釋方法，其特征在于，包括如下步驟：

2.根據權利要求1所述的方法,其特征在于,步驟s2所述對采集到的一級及其二級高分辨質譜信號原始數據處理成開放數據格式,并經過特征提取、離子流構建、特征對齊并扣除空白培養基,最后篩選出僅在目標菌株發酵液中出現的信號特征列表,并作為mna的輸出,具體為:

3.根據權利要求1所述的方法,其特征在于,步驟s...

【專利技術屬性】
技術研發人員：魏斌，俞文超，王鴻，俞琰壘，宣琦，汪澤鈺，
申請(專利權)人：浙江工業大學，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術