System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及生物信息處理領(lǐng)域,具體地涉及一種用于突變位點(diǎn)自動(dòng)化審核的方法及裝置。
技術(shù)介紹
1、臨床樣本ngs分析時(shí),為避免過(guò)濾掉有意義的陽(yáng)性突變,造成漏檢,突變檢測(cè)軟件(如freebayes、vardict、varscan、mutect2)通常會(huì)放寬檢測(cè)的閾值,擴(kuò)大檢測(cè)到的突變數(shù)量。突變檢測(cè)質(zhì)控閾值放寬會(huì)引入假陽(yáng)性的突變,但放大假陽(yáng)性率在臨床也是不能容忍的,因此軟件自動(dòng)檢測(cè)完后,還有大量的突變位點(diǎn)需要人工檢驗(yàn)。
2、人工審核具有以下的局限性:①不同人因?yàn)榻?jīng)驗(yàn)等方面的差異,審核相同的樣本,也常常會(huì)出現(xiàn)不一致的結(jié)果,容易出現(xiàn)主觀性誤判。②審核人員培訓(xùn)成本較大,培養(yǎng)專業(yè)的審核人員,費(fèi)時(shí)費(fèi)力。③人工審核的效率較低,尤其加急樣本較多時(shí),審核人工作負(fù)擔(dān)大,造成極大的人力成本。
3、因此,目前仍需要開發(fā)一種突變位點(diǎn)自動(dòng)化審核方法及裝置,以避免臨床樣本ngs分析中檢出假陽(yáng)性檢測(cè)位點(diǎn)的問(wèn)題,從而實(shí)現(xiàn)快速、準(zhǔn)確、一致性的位點(diǎn)審核。
技術(shù)實(shí)現(xiàn)思路
1、為解決現(xiàn)有技術(shù)中的至少部分問(wèn)題,本專利技術(shù)提供一種突變位點(diǎn)自動(dòng)化審核方法及裝置。本專利技術(shù)的方法準(zhǔn)確性高,不依賴審核人的主觀判斷,并且保證了審核的一致性,同時(shí)審核效率高,每個(gè)月節(jié)省人時(shí)近100小時(shí),并且節(jié)省了培訓(xùn)成本。具體地,本專利技術(shù)包括以下內(nèi)容。
2、本專利技術(shù)的第一方面,提供一種用于突變位點(diǎn)自動(dòng)化審核的方法,其包括以下步驟:
3、(1)獲取測(cè)序讀段作為待審核位點(diǎn);
4、(2)判定支持突變
5、(3)判定突變位點(diǎn)的真假。
6、在某些實(shí)施方案中,根據(jù)本專利技術(shù)所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其中,當(dāng)需要對(duì)體細(xì)胞突變真假進(jìn)行判定時(shí),所述方法還包括:(4)判定所述突變位點(diǎn)在腫瘤對(duì)照樣本中是否為真。
7、本領(lǐng)域知道如何獲取測(cè)序讀段作為待審核位點(diǎn),例如通過(guò)測(cè)序儀或測(cè)序平臺(tái)中得到的測(cè)序數(shù)據(jù)或測(cè)序讀段作為待審核位點(diǎn)。
8、在某些實(shí)施方案中,根據(jù)本專利技術(shù)所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其中,步驟(2)中,根據(jù)以下指標(biāo)判定支持突變的測(cè)序讀段是否是高質(zhì)量的測(cè)序讀段:
9、a.測(cè)序讀段的比對(duì)質(zhì)量;
10、b.突變是否位于測(cè)序讀段的末端;
11、c.測(cè)序讀段上核苷酸編輯的長(zhǎng)度,包括核苷酸的替換、插入和/或缺失;
12、d.測(cè)序讀段上支持突變的堿基質(zhì)量。
13、在某些實(shí)施方案中,根據(jù)本專利技術(shù)所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其中,步驟(2)中,當(dāng)測(cè)序讀段的比對(duì)質(zhì)量的分值高于30、測(cè)序讀段上支持突變的堿基質(zhì)量高于20、突變距離測(cè)序讀段末端高于5bp、測(cè)序讀段上核苷酸編輯長(zhǎng)度小于3時(shí),判定支持突變的測(cè)序讀段為高質(zhì)量的測(cè)序讀段。
14、在某些實(shí)施方案中,根據(jù)本專利技術(shù)所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其中,步驟(3)中,根據(jù)以下指標(biāo)判定突變位點(diǎn)的真假:
15、i.支持突變的高質(zhì)量測(cè)序讀段是否存在偏好,其中采用正負(fù)測(cè)序讀段的數(shù)量的比值來(lái)計(jì)算;
16、ii.突變是否位于基因組的重復(fù)區(qū)域;
17、iii.高質(zhì)量的測(cè)序讀段的數(shù)量是否超過(guò)閾值。
18、在某些實(shí)施方案中,根據(jù)本專利技術(shù)所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其中,步驟(3)中,當(dāng)高質(zhì)量的測(cè)序讀段正負(fù)鏈比值小于10、突變不位于重復(fù)區(qū)域、高質(zhì)量的測(cè)序讀段的數(shù)量大于等于3條時(shí),判定突變位點(diǎn)為真。
19、在某些實(shí)施方案中,根據(jù)本專利技術(shù)所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其中,當(dāng)判定是否為陽(yáng)性體細(xì)胞突變時(shí),進(jìn)一步包括判定在腫瘤對(duì)照樣本中位點(diǎn)是否為假,且當(dāng)高質(zhì)量的測(cè)序讀段正負(fù)鏈比值小于10、突變不位于重復(fù)區(qū)域、高質(zhì)量的測(cè)序讀段的數(shù)量大于等于3條時(shí),判定突變位點(diǎn)為假時(shí),判定該突變位點(diǎn)為陽(yáng)性體細(xì)胞突變。
20、本專利技術(shù)的第二方面,提供一種用于突變位點(diǎn)自動(dòng)化審核的裝置,其包括:
21、待審核位點(diǎn)獲取單元,其用于獲取測(cè)序讀段作為待審核位點(diǎn);
22、高質(zhì)量的測(cè)序讀段判定單元,其用于根據(jù)選擇的第一指標(biāo)和對(duì)應(yīng)的閾值判定支持突變的測(cè)序讀段是否是高質(zhì)量的測(cè)序讀段;
23、突變位點(diǎn)的真假判定單元,其用于根據(jù)選擇的第二指標(biāo)和對(duì)應(yīng)的閾值判定突變位點(diǎn)的真假;
24、優(yōu)選地,所述第一指標(biāo)包括:
25、a.測(cè)序讀段的比對(duì)質(zhì)量;
26、b.突變是否位于測(cè)序讀段的末端;
27、c.測(cè)序讀段上核苷酸編輯的長(zhǎng)度,包括核苷酸的替換、插入和/或缺失;
28、d.測(cè)序讀段上支持突變的堿基質(zhì)量;
29、優(yōu)選地,所述第二指標(biāo)包括:
30、i.支持突變的高質(zhì)量測(cè)序讀段是否存在偏好,其中采用正負(fù)測(cè)序讀段的數(shù)量的比值來(lái)計(jì)算;
31、ii.突變是否位于基因組的重復(fù)區(qū)域;
32、iii.高質(zhì)量的測(cè)序讀段的數(shù)量是否超過(guò)閾值;
33、優(yōu)選地,所述第二指標(biāo)還包括判定所述突變位點(diǎn)在腫瘤對(duì)照樣本中是否為真。
34、本專利技術(shù)的第三方面,提供一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其中,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)第一方面所述的方法。
35、本專利技術(shù)的第四方面,提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被計(jì)算機(jī)執(zhí)行時(shí)實(shí)現(xiàn)第一方面所述的方法。
36、本專利技術(shù)通過(guò)定位突變位點(diǎn),獲取支持突變的reads比對(duì)質(zhì)量、支持突變總reads條數(shù)、支持突變的堿基是否位于reads的末端、支持突變的reads上存在的突變數(shù)是否超過(guò)閾值、支持突變的reads正負(fù)鏈?zhǔn)欠窬庖约巴蛔兪欠裎挥诨蚪M重復(fù)區(qū)域,通過(guò)整合以上信息綜合判讀位點(diǎn)真假。另外,對(duì)于體細(xì)胞突變,還增加了是否為胚系突變的判定。
37、本專利技術(shù)避免了一些突變檢測(cè)軟件會(huì)檢測(cè)出一些假陽(yáng)性突變而需要通過(guò)審核人員使用igv?integrative?genomics?viewer工具進(jìn)行人工檢驗(yàn)來(lái)排除程序檢測(cè)出的假陽(yáng)性位點(diǎn)的問(wèn)題,解決了由于人工檢驗(yàn)容易出現(xiàn)人為誤判、主觀性依賴以及效率較低的問(wèn)題,因此本專利技術(shù)使用python程序?qū)崿F(xiàn)突變位點(diǎn)的快速、準(zhǔn)確且一致性的審核。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,其包括以下步驟:
2.根據(jù)權(quán)利要求1所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,當(dāng)需要對(duì)體細(xì)胞突變真假進(jìn)行判定時(shí),所述方法還包括:(4)判定所述突變位點(diǎn)在腫瘤對(duì)照樣本中是否為真。
3.根據(jù)權(quán)利要求1或2所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,步驟(2)中,根據(jù)以下指標(biāo)判定支持突變的測(cè)序讀段是否是高質(zhì)量的測(cè)序讀段:
4.根據(jù)權(quán)利要求3所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,步驟(2)中,當(dāng)測(cè)序讀段的比對(duì)質(zhì)量的分值高于30、測(cè)序讀段上支持突變的堿基質(zhì)量高于20、突變距離測(cè)序讀段末端高于5bp、測(cè)序讀段上核苷酸編輯長(zhǎng)度小于3時(shí),判定支持突變的測(cè)序讀段為高質(zhì)量的測(cè)序讀段。
5.根據(jù)權(quán)利要求1或2所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,步驟(3)中,根據(jù)以下指標(biāo)判定突變位點(diǎn)的真假:
6.根據(jù)權(quán)利要求5所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,步驟(3)中,當(dāng)高質(zhì)量的測(cè)序讀段正負(fù)鏈比值小于10、突變不位于重復(fù)區(qū)域、高質(zhì)量的測(cè)序讀段的數(shù)量大于等于3條時(shí)
7.根據(jù)權(quán)利要求6所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,當(dāng)判定是否為陽(yáng)性體細(xì)胞突變時(shí),進(jìn)一步包括判定在腫瘤對(duì)照樣本中位點(diǎn)是否為假,且當(dāng)高質(zhì)量的測(cè)序讀段正負(fù)鏈比值小于10、突變不位于重復(fù)區(qū)域、高質(zhì)量的測(cè)序讀段的數(shù)量大于等于3條時(shí),判定突變位點(diǎn)為假時(shí),判定該突變位點(diǎn)為陽(yáng)性體細(xì)胞突變。
8.一種用于突變位點(diǎn)自動(dòng)化審核的裝置,其特征在于,包括:
9.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)權(quán)利要求1-7任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其特征在于,其存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被計(jì)算機(jī)執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7任一項(xiàng)所述的方法。
...【技術(shù)特征摘要】
1.一種用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,其包括以下步驟:
2.根據(jù)權(quán)利要求1所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,當(dāng)需要對(duì)體細(xì)胞突變真假進(jìn)行判定時(shí),所述方法還包括:(4)判定所述突變位點(diǎn)在腫瘤對(duì)照樣本中是否為真。
3.根據(jù)權(quán)利要求1或2所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,步驟(2)中,根據(jù)以下指標(biāo)判定支持突變的測(cè)序讀段是否是高質(zhì)量的測(cè)序讀段:
4.根據(jù)權(quán)利要求3所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,步驟(2)中,當(dāng)測(cè)序讀段的比對(duì)質(zhì)量的分值高于30、測(cè)序讀段上支持突變的堿基質(zhì)量高于20、突變距離測(cè)序讀段末端高于5bp、測(cè)序讀段上核苷酸編輯長(zhǎng)度小于3時(shí),判定支持突變的測(cè)序讀段為高質(zhì)量的測(cè)序讀段。
5.根據(jù)權(quán)利要求1或2所述的用于突變位點(diǎn)自動(dòng)化審核的方法,其特征在于,步驟(3)中,根據(jù)以下指標(biāo)判定突變位點(diǎn)的真假:
6.根據(jù)權(quán)利要求5所述的用于...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李致偉,辛瑤,張美俊,封彥杰,趙玥,田埂,
申請(qǐng)(專利權(quán))人:元碼基因科技北京股份有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。