System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及分析化學的,具體而言,尤其涉及一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法。
技術介紹
1、代謝組學以細胞、組織或生物體中分子量小于1,500道爾頓的物質為研究對象,通過對這些小分子系統性的定性表征與定量量測,從而描述其生理或病理過程的動態變化規律,進而研究生命過程的現象和內在本質,闡釋機理與機制,解決復雜多樣的研究與應用挑戰。
2、代謝物的定性注釋,處在整個代謝組學研究過程的核心節點。其目標是精確識別和確認生物樣本中檢測到的代謝物的化學結構與分子特征,這一步驟對于后續的代謝途徑分析、機制解析和驗證分析等均至關重要。隨著儀器硬件的快速發展,過去十年中,代謝物的定性鑒定技術取得了長足的進步。高分辨質譜技術以其卓越的分辨率、選擇性和檢測靈敏度,已成為非靶向代謝組學研究的首選工具。特別是,超高效液相色譜與高分辨質譜(uplc-hrms)為的結合,為代謝物的檢測提供了一個強大的平臺。在lc-hrms檢測中,色譜保留時間(rt)、全掃描質荷比(m/z)以及二級質譜(ms/ms)等定性信息是注釋分析的關鍵要素。
3、然而,要達到代謝物定性鑒定的金標準,目前仍面臨著一系列困難與挑戰。由于質譜數據的復雜性、實驗條件的多樣性以及標準品的不足,構建通用型數據庫和準確注釋代謝物面臨挑戰。現有的公共數據庫如hmdb、metlin和pubchem等,超過90%的代謝物沒有對應的標準ms/ms質譜數據,限制了定性注釋的廣度和深度。此外,同一化合物的碎片譜圖受到儀器類型、離子源、碎裂方式、實驗參數以及基質效應等多重
技術實現思路
1、根據上述
技術介紹
中提到的技術問題,而提供一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法。
2、本專利技術采用的技術手段如下:
3、一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,包括以下步驟:
4、s1:構建模擬高分辨質譜數據庫;
5、s2:構建強、弱干擾模型,以模擬實際實驗中遇到的不同變化程度的質譜數據;
6、s3:采用8種相似性評價方法,對比干擾模型下待定性質譜在模擬數據庫中的搜索結果,識別在不同干擾條件下準確找到代謝注釋結果的潛力。
7、進一步地,所述構建模擬高分辨質譜數據庫包括以下步驟:
8、s11:采集人類血清樣本量測數據,分別在ab?sciex5600+、agilent6546hplc/q-tof和thermo?scientifictm?q?exactivetm?hf?uplc/q-orbitrap三種儀器下,獲得化合物的mgf格式的原始二級質譜數據,以確定質荷比m/z的分布特征和相應的強度模式;
9、s12:基于質譜特征數量、相鄰m/z差異性,即m/z值差小于0.05da的峰占總峰數的比例,以及特征強度分布三個關鍵因素;使用python編程語言構建{metabolite1:[[m/z1,intensity1],[m/z2,intensity2]...],metabolite2:...}數據結構,以全面表征不同復雜度的代謝物結構;
10、s13:采用正交實驗設計方法,每個因素設定三個水平,生成九個參數組合,并通過模擬算法隨機生成相應的1000個數據集,產生包含9000個質譜數據的子數據庫;
11、s14:在質譜子數據庫的基礎上引入結構相似性,對于產生的9000個質譜數據中的每一個,隨機引入0.05~0.5倍的m/z漂移,以及相對強度的-0.5到0.5倍變化,m/z漂移窗口設置在-1da到1da之間,從而產生12個變體;
12、s15:構建十萬級的虛擬高分辨質譜數據庫。
13、進一步地,所述構建強、弱干擾模型,以模擬實際實驗中遇到的不同變化程度的質譜數據包括以下步驟:
14、s21:采取強干擾策略來模擬質譜變化,隨機選擇0.1~0.2單位的質荷比增減,模擬在極端實驗條件下出現的質荷比變化;
15、s22:引入弱干擾模擬策略,隨機選取基峰強度30%以下的0.05至0.1倍的質荷比進行刪除,增加0.05~0.1倍的質荷比,并采用泊松分布模型為其分配強度值,以模擬背景噪聲信號干擾。
16、進一步地,所述采用8種相似性評價方法,對比干擾模型下待定性質譜在模擬數據庫中的搜索結果,識別它們在不同干擾條件下準確找到代謝注釋結果的潛力包括以下步驟:
17、s31:從子數據庫隨機選取900個質譜數據,對這些質譜引入強、弱干擾策略,模擬極端實驗條件下的質譜變化,生成了待定性物質的測試集;
18、s32:對測試集中每個ms/ms光譜應用8種相似性評價方法;8種相似性評價方法的結果均在[0,1]區間內,其中1表示完美的正相關,0表示沒有相關性;
19、s33:對相似性方法性能進行評價,質譜相似性搜索結果正確率越高,則性能越好;采用因素水平分析、極差分析深入探討打分算法與質譜特征之間的聯系。
20、進一步地,所述8種相似性評價方法包括:entropy?similarity(es),dot?product(dp),weighted?dot?product(wdp),ms?for?id(ms4id),pearson?correlationcoefficient(pcc),bhattacharya?similarity(bs),harmonic?mean(hm),euclideandistance(ed)。
21、進一步地,所述8種相似性評價方法計算相似性的公式為:
22、
23、其中,m表示質荷比;i表示強度;q表示測試譜是一個峰的集合:(mq,1,iq,1),...,(mq,i,iq,i);r表示庫譜,定義為(mr,1,ir,1),...,(mr,i,ir,i);nq、nr表示光譜q、r的碎片離子的數量;nm表示匹配的片段離子的總數;分別表示測試譜、庫譜的平均強度;
24、較現有技術相比,本專利技術具有以下優點:
25、本專利技術有效的提高定性注釋的準確性。通過模擬數據庫的構建和相似性搜索算法的評估,本專利技術為解決hrms分析中的質譜數據復雜性問題提供了新的視角和工具,從而提高了代謝物定性注釋的準確性。通過引入強、弱干擾模擬策略,本專利技術評估和優化了代謝物定性注釋算法的魯棒性,使其能夠更好地適應實際實驗中可能遇到的質譜數據變化。
26、本專利技術不僅為評價代謝物定性注釋結果提供了新的策略和方法,而且對于推動發現代謝組學的研究具有重要的科學意義和應用價值。
本文檔來自技高網...【技術保護點】
1.一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,
3.根據權利要求1所述的一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,所述構建強、弱干擾模型,以模擬實際實驗中遇到的不同變化程度的質譜數據包括以下步驟:
4.根據權利要求1所述的一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,所述采用8種相似性評價方法,對比干擾模型下待定性質譜在模擬數據庫中的搜索結果,識別它們在不同干擾條件下準確找到代謝注釋結果的潛力包括以下步驟:
5.根據權利要求1或4所述的一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,所述8種相似性評價方法包括:entropy?similarity(ES),dot?product(DP),weighted?dot?product(WDP),MS?for?ID(MS4ID),Pearson?correlationcoefficient(PCC),Bhatta
6.根據權利要求1或4所述的一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,所述8種相似性評價方法計算相似性的公式為:
...【技術特征摘要】
1.一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,
3.根據權利要求1所述的一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,所述構建強、弱干擾模型,以模擬實際實驗中遇到的不同變化程度的質譜數據包括以下步驟:
4.根據權利要求1所述的一種基于高分辨質譜模擬的代謝物定性注釋質量評價方法,其特征在于,所述采用8種相似性評價方法,對比干擾模型下待定性質譜在模擬數據庫中的搜索結果,識別它們在不同干擾條件下準確找到代謝注釋結果的潛力包括以下步驟:
5.根據...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。