本發明專利技術提供一種確定核酸序列的方法,包括,獲取待測樣本中的核酸,對所述核酸進行測序,獲得由多個測序序列構成的測序結果;將所述測序結果進行過濾,所述過濾包括去除不確定堿基比例大于1%的讀段和/或堿基質量值不大于5的堿基數的比例不小于50%的讀段,獲得過濾后的測序結果;將所述過濾后的測序結果與第一數據庫進行第一比對,獲得第一比對結果;以及將所述第一比對結果與第二數據庫進行第二比對,獲得第二比對結果;分析所述第二比對結果,確定待測樣本的核酸序列。本發明專利技術還提供一種確定核酸序列的系統。本發明專利技術基于生物信息學分析手段與強大的數據庫平臺來對樣本中的微生物種類進行鑒定,具有結果靈敏、特異性強等優點。
【技術實現步驟摘要】
本專利技術涉及生物
,具體的,一種確定核酸序列的方法及系統,以及一種計算核酸序列豐度及相對豐度的方法及系統。
技術介紹
人或動物的腦脊液中寄生有大量的細菌或病毒等微生物,通過對腦脊液中微生物的研究,可以促進對腦脊液中微生物的寄生情況更加了解。目前主要用于研究腦脊液中微生物的方法有抗原-抗體聯合檢測(酶標法)和熒光定量PCR技術等,這些技術目前在研究領域起了巨大的作用,但仍存在一些缺點。酶標法檢測技術局限性很大,絕大多數情況下只能對已知的微生物進行相應的抗原抗體檢測;而熒光定量PCR技術本身的優越性是無可厚非的,但對于腦脊液(CFS)樣本來說,由于其細胞總RNA含量較低、并且容易降解,使用熒光定量PCR檢測CSF中RNA較困難。因此,這些缺點需要應用新的技術去彌補。
技術實現思路
依據本專利技術的一方面,本專利技術提供一種確定核酸序列的方法,包括,(1)獲取待測樣本中的核酸,對所述核酸進行測序,獲得由多個測序序列構成的測序結果;(2)將所述測序結果進行過濾,所述過濾包括去除不確定堿基比例大于1%的讀段和/或堿基質量值不大于5的堿基數的比例不小于50%的讀段,獲得過濾后的測序結果;(3)將所述過濾后的測序結果與第一數據庫進行第一比對,獲得第一比對結果;以及(4)將所述第一比對結果與第二數據庫進行第二比對,獲得第二比對結果;(5)分析所述第二比對結果,確定待測樣本的核酸序列。本專利技術另一方面提供一種計算核酸序列豐度及相對豐度的方法,包括:利用上述核酸序列的方法獲得核酸序列信息;基于所述核酸序列信息,通過公式1計算待測樣本中各物種的豐度,所述公式1為:1i為第二數據庫中物種;N為比對到第二數據庫的全部序列長度;Ni為比對到物種上的序列長度;Li為物種i的基因組長度;bi為豐度;以及,通過公式2計算待測樣本中各物種的相對豐度,所述公式2為:2i,j為第二數據庫中物種;sbi為相對豐度。本專利技術另一方面還提供一種確定核酸序列的系統,包括:測序結果獲得模塊,用于獲取待測樣本中的核酸,對所述核酸進行測序,獲得由多個測序序列構成的測序結果;測序結果過濾模塊,用于將所述測序結果進行過濾,所述過濾包括去除不確定堿基比例大于1%的讀段和/或堿基質量值不大于5的堿基數的比例不小于50%的讀段,獲得過濾后的測序結果;第一比對模塊,用于將所述過濾后的測序結果與第一數據庫進行第一比對,獲得第一比對結果;以及第二比對模塊,用于將所述第一比對結果與第二數據庫進行第二比對,獲得第二比對結果;核酸序列確定模塊,用于分析所述第二比對結果,確定待測樣本的核酸序列。本專利技術另一方面還提供一種計算核酸序列豐度及相對豐度的系統,包括:核酸序列獲取模塊,用于利用前述確定核酸序列的系統獲得所述核酸序列信息;計算模塊,用于基于所述核酸序列信息,通過公式1計算待測樣本中各物種的豐度,所述公式1為:1i為第二數據庫中物種;N為比對到第二數據庫的全部序列長度;Ni為比對到物種上的序列長度;Li為物種i的基因組長度;bi為豐度;以及,通過公式2計算待測樣本中各物種的相對豐度,所述公式2為:2i,j為第二數據庫中物種;sbi為相對豐度。本專利技術建立了一種高通量測序技術的用于輔助確定人或動物體內腦脊液中微生物的方法。該方法基于生物信息學分析手段與強大的數據庫平臺來對樣本中的微生物種類進行鑒定,整個分析流程大約需要3-5天的時間。此方法彌補了常規培養檢測方法檢測周期長,微生物種類比較局限的缺點,可很好的應用于腦脊液中微生物的確定,并且具有結果靈敏、特異性強等優點。附圖說明本專利技術的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變得明顯和容易理解,其中:圖1 顯示了根據本專利技術的一個實施例,確定核酸序列的方法的流程圖。具體實施方式本專利技術中的數據庫為已知基因組數據庫,本專利技術中所使用的“第一”、“第二”等僅為方便描述指代,不能理解為指示或暗示相對重要性,也不能理解為有先后順序關系。本專利技術的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。術語“豐度”指的是在限定的位置或群落中一種生物體的常見性或稀有性。例如,可以通過一般地測量樣品中該生物體的總存在量來確定所述豐度。術語“相對豐度”指的是在限定的位置或群落中一種生物體相對于其它生物體的常見性或稀有性。例如,可以通過一般地測量樣品中與生物體的總存在量相比的特定生物體的存在量來確定所述豐度。本專利技術提供一種確定核酸序列的方法,包括,(1)獲取待測樣本中的核酸,對所述核酸進行測序,獲得由多個測序序列構成的測序結果;(2)將所述測序結果進行過濾,所述過濾包括去除不確定堿基比例大于1%的讀段和/或堿基質量值不大于5的堿基數的比例不小于50%的讀段,獲得過濾后的測序結果;(3)將所述過濾后的測序結果與第一數據庫進行第一比對,獲得第一比對結果;以及(4)將所述第一比對結果與第二數據庫進行第二比對,獲得第二比對結果;(5)分析所述第二比對結果,確定待測樣本的核酸序列。在本專利技術的一個實施例中,本專利技術的步驟(1)還包括:(a)獲取待測樣本中的核酸,所述核酸由多個DNA片段組成,所述DNA片段來自斷裂的基因組DNA和/或游離的DNA片段,并且所述DNA片段具有平末端;(b)加堿基“A”至所述DNA片段的3’端,獲得具有粘性末端A的DNA片段;(c)對所述具有粘性末端A的DNA片段添加接頭,獲得接頭連接片段;(d)將接頭連接片段進行PCR擴增,獲得擴增產物;(e)將擴增產物進行純化,獲得純化后的PCR產物;(f)對所述純化后的PCR產物進行測序。進一步的,在獲取所述待測樣本中的核酸后,還可以將核酸片段進行打斷。所述打斷的方法可以采用本領域常規的方法進行,例如超聲打斷,優選采用covaris打斷儀進行打斷。打斷后的片段長度為200-250 bp。進一步的,所述DNA片段具有平末端是通過末端修復的方法制備。根據本專利技術的一個實施例,在將DNA片段進行末端修復前,可以進一步包括純化DNA片段的步驟,由此,使得后續的末端修復易于進行。根據本專利技術的實施例,將DNA片段進行末端修復可以利用Klenow片段、T4 DNA聚合酶和T4多核苷酸激酶進行,其中,所述Klenow片段具有5’—3’聚合酶活性和3’ —5’聚合酶活性,但缺少5’ —3’外切酶活性。由此,能夠方便準確地對DNA片段進行末端修復。根據本專利技術的實施例,還可以進一步包括對經過末端修復的DNA片段進行純化的步驟,由此能夠方便地進行后續處理。進一步的,在經過末端修復的DNA片段的3’末端添加堿基A,以便獲得具有粘性末端A的DNA片段。根據本專利技術的一個實施例,可以利用Klenow(3’ —5’exo-),即具有3’ —5’外切酶活性的Klenow,在經過末端修復的DNA片段的3’末端添加堿基A。由此,能夠方便準確地將堿基A添加到經過末端修復的DNA片段的3’末端。根據本專利技術的實施例,還可以進一步包括對具有粘性末端A的DNA片段進行純化的步驟,由此能夠方便地進行后續處理。進一步的,對所述具有粘性末端A的DNA片段添加接頭。進一步的,可以使用熱啟動taq DNA聚合酶對經過轉換的目的片段進行PCR擴增。根據本專利技術的實施例,熱啟動taq DNA聚合酶的種類不受特別限制,根據本專利技術的具體示例,熱啟本文檔來自技高網...
【技術保護點】
一種確定核酸序列的方法,其特征在于,包括,(1)獲取待測樣本中的核酸,對所述核酸進行測序,獲得由多個測序序列構成的測序結果;(2)將所述測序結果進行過濾,所述過濾包括去除不確定堿基比例大于1%的讀段和/或堿基質量值不大于5的堿基數的比例不小于50%的讀段,獲得過濾后的測序結果;(3)將所述過濾后的測序結果與第一數據庫進行第一比對,獲得第一比對結果;以及(4)將所述第一比對結果與第二數據庫進行第二比對,獲得第二比對結果;(5)分析所述第二比對結果,確定待測樣本的核酸序列。
【技術特征摘要】
1.一種確定核酸序列的方法,其特征在于,包括,(1)獲取待測樣本中的核酸,對所述核酸進行測序,獲得由多個測序序列構成的測序結果;(2)將所述測序結果進行過濾,所述過濾包括去除不確定堿基比例大于1%的讀段和/或堿基質量值不大于5的堿基數的比例不小于50%的讀段,獲得過濾后的測序結果;(3)將所述過濾后的測序結果與第一數據庫進行第一比對,獲得第一比對結果;以及(4)將所述第一比對結果與第二數據庫進行第二比對,獲得第二比對結果;(5)分析所述第二比對結果,確定待測樣本的核酸序列。2.根據權利要求1所述的方法,其特征在于,所述步驟(1)還包括:(a)獲取待測樣本中的核酸,所述核酸由多個DNA片段組成,所述DNA片段來自斷裂的基因組DNA和/或游離的DNA片段,并且所述DNA片段具有平末端;(b)加堿基“A”至所述DNA片段的3’端,獲得具有粘性末端A的DNA片段;(c)對所述具有粘性末端A的DNA片段添加接頭,獲得接頭連接片段;(d)將接頭連接片段進行PCR擴增,獲得擴增產物;(e)將擴增產物進行純化,獲得純化后的PCR產物;(f)對所述純化后的PCR產物進行測序。3.根據權利要求1所述的方法,其特征在于,所述步驟(3)還包括:將所述過濾后的測序結果與第一數據庫進行第一比對,去除匹配的測序序列,獲得非匹配的測序序列。4.根據權利要求1所述的方法,其特征在于,所述步驟(4)還包括:將所述第一比對結果與第二數據庫進行第二比對,獲得匹配的測序序列,去除非匹配的測序序列。5.根據權利要求1所述的方法,其特征在于,所述第一數據庫為宿主基因數據庫;所述第二數據庫為細菌數據庫或病毒數據庫至少之一;所述宿主為人或動物。6.一種計算核酸序列豐度及相對豐度的方法,其特征在于,包括:利用權利要求1所述的方法獲得核酸序列信息;基于所述核酸序列信息,通過公式1計算待測樣本中各物種的豐度,所述公式1為:1i為第二數據庫中物種;N為比對到第二數據庫的全部序列...
【專利技術屬性】
技術研發人員:張印新,韓穎鑫,王佳偉,高曉峘,張春生,李勝,
申請(專利權)人:廣州精科生物技術有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。