System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本專利技術屬于生物信息分析領域,特別是涉及分析突變是否位于同一基因單倍型的方法和裝置。
技術介紹
1、目前用于腫瘤患者的一線、二線和輔助治療的藥物能夠顯著改善腫瘤患者的預后。盡管療效顯著,但耐藥不可避免地出現(xiàn),并導致疾病進展。例如,egfr?c797x是非小細胞肺癌(nsclc)患者在接受奧希替尼治療后常見的靶內耐藥突變。既往研究表明,不同突變是否位于相同等位基因直接影響患者治療方案。例如,攜帶egfr?c797s突變,無egfr?t790m突變的患者對一代和二代egfr-tkis敏感,同時攜帶egfr?t790m和egfr?c797s突變且二者位于不同單倍型的患者使用一代和三代egfr-tkis聯(lián)合治療。同時攜帶egfr?t790m和egfrc797s突變且二者位于相同單倍型將會對一代、二代和三代egfr-tkis單藥耐藥,需要使用新型研究中的單藥或藥物聯(lián)合方案治療。因此判斷不同突變是否位于同一基因單倍型對于患者治療方案的確定非常關鍵。
2、基于sanger測序技術直接檢測步驟繁雜、耗費時間較長以及檢出突變頻率要求較高。基于ngs的方法可以同時快速、準確的檢出。然而,臨床樣本ngs分析時,為避免過濾掉有意義的陽性突變,突變檢測軟件(如freebayes、vardict、varscan、mutect2)通常會放寬檢測的閾值,擴大檢測到的突變數(shù)量。突變檢測質控閾值放寬會引入假陽性的突變,因此有大量的突變位點需要人工檢驗。人工審核具有很多局限性,例如:(1)不同人審核相同樣本,容易出現(xiàn)主觀性誤判;(2)審核人員培訓成本較
3、因此,目前仍需要一種基于多基因檢測的同時準確、快速的識別突變是否位于同一基因單倍型的方法和裝置,從而為腫瘤患者的精準治療提供指導。
技術實現(xiàn)思路
1、為解決上述現(xiàn)有技術中的至少部分技術問題,本專利技術提供一種分析突變是否位于同一基因單倍型的方法和裝置,本專利技術的方法通過多等位位點拆分、hgvs矯正、位點自動化審核,得到待分析突變位點各自支持讀段的集合,進一步通過確定集合的差集和交集,實現(xiàn)突變是否位于同一基因單倍型的準確判定。具體地,本專利技術包括以下內容。
2、本專利技術的第一方面,提供一種分析突變是否位于同一基因單倍型的方法,其包括以下步驟:
3、(1)以突變結果文件、樣本比對結果文件、基因的轉錄本文件和待分析突變位點信息為輸入?yún)?shù)進行多等位位點拆分,得到拆分后的突變結果文件;
4、(2)對所述拆分后的突變結果文件進行hgvs矯正,得到矯正后數(shù)據(jù);
5、(3)對所述矯正后數(shù)據(jù)進行位點自動化審核,得到待分析突變位點各自支持讀段的集合;
6、(4)確定所述集合的差集和交集,如果交集中支持讀段的數(shù)量大于等于3并且大于等于所有差集支持讀段的數(shù)量的最小值,則判定待分析突變位于同一基因單倍型,否則判定為突變不位于同一基因單倍型。
7、本專利技術中,待分析突變位點包括任何突變位點間的距離小于測序讀段長度的至少兩個突變,這樣的突變包括點突變、插入突變或缺失突變。可以理解,突變可以是同一基因上測序讀段長度內多于2個位點的突變,例如3、4個位點的突變。以egfr為例,可以聯(lián)合egfr基因上t790m、l792h、g796r和c797s等突變中的兩種或多種確定其是否位于同一基因單倍型。
8、在某些實施方案中,根據(jù)本專利技術所述的方法,其中,所述突變包括至少兩個位點的突變,且所述位點間的距離小于150bp,優(yōu)選小于145bp,還優(yōu)選小于140bp,進一步優(yōu)選小于135bp,更優(yōu)選小于130bp,例如小于130、125、120、115、110、105、100、95、90、85、80、75、70、65、60、55、50、45、40、35、30、25、20bp。
9、在某些實施方案中,根據(jù)本專利技術所述的方法,其中,所述樣本包括腫瘤組織樣本或流體樣本,流體樣本包括但不限于血液、滑膜液和腦脊液等,含ctdna的上述組織或流體樣本是優(yōu)選的。
10、在某些實施方案中,根據(jù)本專利技術所述的方法,其中,所述多等位位點拆分包括:
11、(i)將所述突變結果文件中以分隔符隔開的檢測樣本基因組序列的等位基因拆分成多行;
12、(ii)根據(jù)拆分后的檢測樣本基因組序列的堿基與參考(ref)堿基的差異對檢測樣本基因組序列的堿基進行矯正,得到矯正后堿基信息;
13、(iii)根據(jù)所述矯正后檢測樣本基因組序列的堿基信息和參考堿基信息,對突變位點的物理位置進行矯正;
14、進一步包括(iv):拆分突變的注釋信息。
15、在某些實施方案中,根據(jù)本專利技術所述的方法,其中,所述注釋信息包括等位基因平衡、等位基因平衡概率、所有突變等位基因的總數(shù)、等位基因頻率、特定突變等位基因支持讀段數(shù)、特定突變等位基因的cigar值、特定突變等位基因深度比值、末端定位概率、特定突變等位基因長度、突變等位基因反向鏈支持讀段數(shù)、突變等位基因正向鏈支持讀段數(shù)和突變類型。
16、在某些實施方案中,根據(jù)本專利技術所述的方法,其中,所述hgvs矯正包括:
17、(a)輸入突變檢測結果:所述突變檢測結果包含突變的類型、位置和參考序列;
18、(b)突變分類:對所述突變檢測結果進行分類,以區(qū)分為c點突變和p點突變;
19、(c)進行c點突變矯正;
20、(d)進行p點突變矯正;
21、(e)進行突變注釋。
22、在某些實施方案中,根據(jù)本專利技術所述的方法,其中,所述c點突變矯正包括:
23、識別cdna序列:根據(jù)參考基因組和轉錄本信息確定cdna序列;
24、突變映射:將測序讀段映射到cdna序列上,確定突變的確切位置;
25、剪接位點分析:檢查突變是否位于剪接位點或剪接位點附近;
26、編碼區(qū)分析:確定突變是否位于編碼區(qū),并分析其對編碼序列的影響。
27、在某些實施方案中,根據(jù)本專利技術所述的方法,其中,所述p點突變矯正包括:
28、蛋白質序列確定:根據(jù)所述cdna序列翻譯成蛋白質序列;
29、突變效應預測:分析突變對蛋白質序列的影響;
30、功能域分析:確定突變是否發(fā)生在蛋白質的功能域或結構域上;
31、遺傳密碼子表矯正:矯正突變注釋錯誤。
32、在某些實施方案中,根據(jù)本專利技術所述的方法,其中,所述自動化審核包括:
33、(1’)確定支持位點的讀段比對質量高于30;
34、(2’)確定突變堿基質量高于20;
35、(3’)確定突變位置不位于讀段末端;
36、(4’)確定讀段的編輯距離標簽小于4;
37、(5’)確定不存在正負鏈偏好并且突變位點不處于基因組重復區(qū)域。
38、本專利技術中本文檔來自技高網(wǎng)...
【技術保護點】
1.一種分析突變是否位于同一基因單倍型的方法,其特征在于,包括以下步驟:
2.根據(jù)權利要求1所述的分析突變是否位于同一基因單倍型的方法,其特征在于,所述突變包括至少兩個位點的突變,所述位點間的距離小于測序讀段長度。
3.根據(jù)權利要求1所述的分析突變是否位于同一基因單倍型的方法,其特征在于,所述樣本包括腫瘤組織樣本或流體樣本。
4.根據(jù)權利要求1所述的分析突變是否位于同一基因單倍型的方法,其特征在于,所述多等位位點拆分包括將所述突變結果文件中以分隔符隔開的檢測樣本基因組序列的等位基因拆分成多行的步驟,其中,根據(jù)拆分后的檢測樣本基因組序列的堿基與參考堿基的差異對檢測樣本基因組序列的堿基進行矯正,得到矯正后堿基信息,根據(jù)所述矯正后檢測樣本基因組序列的堿基信息和參考堿基信息,對突變位點的物理位置進行矯正;
5.根據(jù)權利要求1所述的分析突變是否位于同一基因單倍型的方法,其特征在于,所述HGVS矯正包括:
6.根據(jù)權利要求4所述的分析突變是否位于同一基因單倍型的方法,其特征在于,所述c點突變矯正包括:
7.根據(jù)權利要求1
8.分析突變是否位于同一基因單倍型的裝置,其特征在于,包括:
9.計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1至7任一項所述的方法的步驟。
10.電子設備,其特征在于,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權利要求1至7任一項所述的方法的步驟。
...【技術特征摘要】
1.一種分析突變是否位于同一基因單倍型的方法,其特征在于,包括以下步驟:
2.根據(jù)權利要求1所述的分析突變是否位于同一基因單倍型的方法,其特征在于,所述突變包括至少兩個位點的突變,所述位點間的距離小于測序讀段長度。
3.根據(jù)權利要求1所述的分析突變是否位于同一基因單倍型的方法,其特征在于,所述樣本包括腫瘤組織樣本或流體樣本。
4.根據(jù)權利要求1所述的分析突變是否位于同一基因單倍型的方法,其特征在于,所述多等位位點拆分包括將所述突變結果文件中以分隔符隔開的檢測樣本基因組序列的等位基因拆分成多行的步驟,其中,根據(jù)拆分后的檢測樣本基因組序列的堿基與參考堿基的差異對檢測樣本基因組序列的堿基進行矯正,得到矯正后堿基信息,根據(jù)所述矯正后檢測樣本基因組序列的堿基信息和參考堿基信息,對突變位點的物理位置進行矯正;
...【專利技術屬性】
技術研發(fā)人員:李致偉,張美俊,封彥杰,辛瑤,王鵬輝,田埂,
申請(專利權)人:元碼基因科技北京股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。