System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
:dna甲基化在調節基因表達中扮演一重要的角色。異常的dna甲基化與許多疾病過程有關,包括癌癥。使用甲基化定序(例如,全基因組亞硫酸氫鹽定序(wgbs))的dna甲基化譜圖被日益被認為是用于檢測、診斷及/或監測癌癥的一有價值的診斷工具。例如,差異甲基化區域的特異模式及/或等位基因特異甲基化模式可作為使用循環細胞游離dna的非侵入性診斷的分子標記。然而,本領域仍需要用于分析來自細胞游離dna的甲基化定序資料以檢測、診斷及/或監測諸如癌癥的疾病的改良方法。
技術介紹
技術實現思路
1、在受試者中及早發現癌癥是重要的,由于其給予較早的治療,而因此有更大的存活機會。細胞游離dna(cfdna)片段的定序以及在片段中胞嘧啶及鳥嘌呤的各種二核苷酸(稱為cpg位點)的甲基化狀態分析可協助了解受試者是否罹患癌癥。為此,此描述包括用于分析cfdna片段的cpg位點的甲基化狀態的方法。具體地,本公開提供一種識別具有或可能具有一異常的甲基化模式的一cfdna片段的方法。在未罹患癌癥的個體中,高頻率出現的片段未必能產生用于區分癌癥狀態的高度識別特征。因此,相對于來自一健康樣品(例如,未罹患癌癥的一受試者)的cfdna片段而言,具有一異常的甲基化模式的識別對于cfdna片段的選擇是重要的,所述cfdna片段可表明檢測具有低干擾的癌癥特異性甲基化模式。在低干擾區域中,可選擇衍生自基因組區域的cfdna片段,其在識別一癌癥患者及一健康受試者,或者具有其他健康狀況的受試者是最有用的。一癌癥患者與一健康受試者之間的可使用針對來
2、在一實施例中,自一對照組的一受試者獲得包括多個cfdna片段的一測試樣品。處理所述測試樣品中的多個cfdna片段,以將未甲基化的胞嘧啶轉化為尿嘧啶,將cfdna片段進行定序,并與一參考基因組進行比較,以識別多個cpg位點中各個cpg位點的甲基化狀態。一分析系統建立一數據結構,所述數據結構針對所述參考基因組中各個已識別的cpg位點,自所述cpg位點開始,對于來自具有一些cpg位點的一特定甲基化字符串的對照組片段數目進行甲基化與未甲基化的計數。
3、分析系統為各個定序片段建立一甲基化狀態載體,其中所述甲基化狀態載體包括在片段中的cpg位點以及彼等的甲基化狀態,例如,經甲基化、未經甲基化或不確定。對于各個片段,所述分析系統使用概率分析及對照組數據結構,以識別所觀察的一給定片段(或其部分)的意外情況,所述給定片段(或其部分)在片段中的cpg位點具有所述觀察到的甲基化狀態。在一特定的實施例中,此種概率分析列舉與一給定片段(或其部分)在所述參考基因組中具有一相同的長度(在位點)及位置的甲基化狀態載體的替代可能性,并使用來自所述數據結構的計數,以確定各個所述可能性的概率。所述分析系統可使用一馬爾可夫鏈概率分析(連同一給定的馬爾可夫鏈的一最大次序),以對各個所述的甲基化狀態載體的各種可能性的概率建立模型。在計算甲基化狀態載體的各種可能性的概率之后,所述分析系統通過將針對甲基化狀態載體的可能性的彼等概率的總和,以為所述片段產生一p值分數,所述甲基化狀態載體的可能性的概率是小于與所述測試甲基化狀態載體的可能性相匹配的概率。所述分析系統將所產生的p值與一閾值進行比較,以識別相對于所述對照組的異常的甲基化的cfdna片段(在本文中亦稱為具有異常的甲基化模式的片段)。
4、除了所述分析系統之外,一分類器基于一概率亦協助將一受試者分類為罹患癌癥或未罹患癌癥。所述分類器是在來自罹患癌癥的受試者所獲得的甲基化定序資料,及/或未罹患癌癥的受試者所獲得的甲基化定序資料上進行訓練。在針對各個經定序的cfdna片段進行定序并產生一甲基化狀態載體之后,使用相較于健康對照組被識別為經低甲基化或經高甲基化的cfdna片段來訓練分類器。如本文中所使用,“經低甲基化”cfdna片段可被定義為具有至少5個cpg位點且至少80%的所述cpg位點未被甲基化的片段。相似地,“經高甲基化的”cfdna片段可被定義為具有至少5個cpg位點且至少80%的cpg位點被甲基化的片段。之后,所述分類器在基因組中的各個cpg位點進行運行,并計算一低甲基化分數及一高甲基化分數。二者分數的計算方法相似。針對所述低甲基化分數,所述分類器計算包括當前的cpg位點的被視為低甲基化的癌癥片段占所有的片段,癌癥及非癌癥,包括當前的cpg位點的被視為低甲基化的癌癥片段的比率。相似地,采用被認為是高甲基化的癌癥片段占被認為是高甲基化的所有片段的比率,以計算各個cpg位點的所述高甲基化分數。
5、現在,所述分類器自所述訓練組中取得一受試者連同其多個cfdna片段,并對所述片段進行定序以產生甲基化狀態載體。利用針對所述受試者的各個甲基化狀態載體,所述分類器計算一合計的高甲基化分數及一合計的低甲基化分數。基于各個cpg位點的低甲基化分數及高甲基化分數計算各個合計的分數。之后,所述分類器通過受試者的合計的低甲基化分數對受試者的甲基化狀態載體進行排名,亦通過受試者的合計的高甲基化分數進行排名。利用二者排名,所述分類器通過自所述排名中選擇分數,以為所述受試者產產生一特征載體。之后將所述分類器進行訓練,以將對應于非癌癥訓練組的特征載體以及對應于癌癥訓練組的特征載體區進行區分。在一實施例中,所述分類器利用具有一高斯徑向基函數核(rbf核)的l2正規化核邏輯回歸。
6、據此,在一方面,本公開提供一種用于檢測在一細胞游離脫氧核糖核酸(cfdna)樣品片段中一異常的甲基化模式的方法,所述方法包括:存取一數據結構,所述數據結構包括:在一參考基因組內的多個cpg位點的字符串的計數,以及來自一訓練片段集的所述多個cpg位點個別的甲基化狀態;產生用于一樣品片段的一樣品狀態載體,所述樣品狀態載體包括:在所述參考基因組內的一樣品基因組位置及在所述樣品片段中的各個cpg位點的一甲基化狀態,各個甲基化狀態被確定為經甲基化或未經甲基化;自所述樣品基因組位置列舉與所述樣品狀態載體的長度相同的多個甲基化狀態的多個可能性;針對各種可能性,通過存取存儲在所述數據結構中的多個計數以計算一概率;確定與所述樣品狀態載體相匹配的所述可能性,并相應地將所述經計算的概率作為一樣品概率;基于所述樣品概率,相對于所述訓練片段集,針對所述樣品狀態載體的所述樣品片段產生一分數;以及基于所述產生的分數,確定所述樣品片段是否具有一異常的甲基化模式。
7、在一些實施例中,所述各個cpg位點的字符串包括:在所述參考基因組內的多個基因組位置處的各個所述cpg位點的所述甲基化狀態,其中各個所述甲基化狀態被確定為經甲基化或未經甲基化。
8、在一些實施例中,所述方法進一步包括:自所述訓練片段集構建所述數據結構,且包括:針對在所述訓練片段集中的各個訓練片段,產生一訓練狀態載體,所本文檔來自技高網...
【技術保護點】
1.一種確定一測試對象是否罹患癌癥的方法,其特征在于:所述方法包括:步驟:
2.如權利要求1所述的方法,其特征在于:所述閾值數目是5或更大。
3.如權利要求1所述的方法,其特征在于:所述閾值百分比是80%或更大。
4.一種確定一測試對象是否罹患癌癥的方法,其特征在于:所述方法包括步驟:
5.一種用于預測來自一疑似罹患癌癥的測試對象的一測試片段是否具有一異常的甲基化模式的方法,其特征在于:所述方法包括步驟:
6.一種非暫時性計算機可讀存儲介質,其特征在于:所述非暫時性計算機可讀存儲介質存儲用于確定一測試對象是否罹患癌癥的多個可執行指令,當所述多個可執行指令在通過一硬件處理器執行時,使所述硬件處理器執行以下步驟:
7.一種非暫時性計算機可讀存儲介質,其特征在于:所述非暫時性計算機可讀存儲介質存儲用于確定一測試對象是否罹患癌癥的可執行指令,當所述可執行指令在通過一硬件處理器執行時,使所述硬件處理器執行以下步驟:
8.一種非暫時性計算機可讀存儲介質,其特征在于:所述非暫時性計算機可讀存儲介質存儲用于確定來
9.一種非暫時性計算機可讀存儲介質,其特征在于:所述非暫時性計算機可讀存儲介質存儲多個可執行指令,當所述多個可執行指令由一硬件處理器執行時,使所述處理器執行一分類器以診斷癌癥,其中所述分類器是由以下過程所產生,所述過程包括:
10.一種非暫時性計算機可讀存儲介質,其特征在于:所述非暫時性計算機可讀存儲介質存儲多個可執行指令,當所述多個可執行指令由一硬件處理器執行時,使所述處理器執行一分類器以診斷癌癥,其中所述分類器是由以下過程所產生,所述過程包括:
...【技術特征摘要】
1.一種確定一測試對象是否罹患癌癥的方法,其特征在于:所述方法包括:步驟:
2.如權利要求1所述的方法,其特征在于:所述閾值數目是5或更大。
3.如權利要求1所述的方法,其特征在于:所述閾值百分比是80%或更大。
4.一種確定一測試對象是否罹患癌癥的方法,其特征在于:所述方法包括步驟:
5.一種用于預測來自一疑似罹患癌癥的測試對象的一測試片段是否具有一異常的甲基化模式的方法,其特征在于:所述方法包括步驟:
6.一種非暫時性計算機可讀存儲介質,其特征在于:所述非暫時性計算機可讀存儲介質存儲用于確定一測試對象是否罹患癌癥的多個可執行指令,當所述多個可執行指令在通過一硬件處理器執行時,使所述硬件處理器執行以下步驟:
7.一種非暫時性計算機可讀存儲介質,其特征在于:所述非暫時性計算機可讀存儲介質存儲用于確定一測試對象是否罹患癌癥的可執行指令,...
【專利技術屬性】
技術研發人員:薩繆爾·S·格羅斯,康斯坦丁·達維多夫,
申請(專利權)人:格里爾公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。