本發明專利技術公開用于長片段端粒序列測序的接頭
【技術實現步驟摘要】
用于長片段端粒序列測序的接頭、預文庫及其構建方法
[0001]本專利技術涉及基因測序,具體地涉及用于完整或長片段端粒序列測序的接頭
、
預文庫及其構建方法
。
技術介紹
[0002]端粒是位于真核生物線性染色體末端,由端粒
DNA
重復序列和相關蛋白質構成的復合物
。
由于線性染色體的
DNA
復制機制,使得細胞的每次分裂導致端粒縮短
。
端粒的變化與多種疾病密切相關,如癌癥
、
早衰綜合征等
。
因此盡可能準確的對端粒進行檢測可以提供與疾病相關的重要信息
。
[0003]由于端粒序列較長,且其中含有大量6堿基簡單重復序列,人端粒序列的重復單元為
TTAGGG(forward strand)/CCCTAA(reverse strand)
,總長度約
2kb
?
20kb
,使用二代測序
(NGS
,代表平臺為
Illumina、MGI)
無法測通,只能使用針對長片段測序方法
(
比如納米孔測序技術
)
對長度在
5kb
以上的片段進行序列測定
。
[0004]在上述測序中的常規建庫方法依然存在無法區分完整端粒末端和基因組斷裂端點的問題,由于基因組在提取過程中會造成大量斷裂端點,此外還會存在一定量的不完整端粒末端,數量遠遠多于完整的端粒末端,常規的端粒建庫方式無法有效地對其進行區分,將會導致這一類的建庫方法無法對完整或長片段端粒序列進行有效富集,長片段端粒序列占比極低,短片段偏好嚴重,導致文庫有效數據占比低下,會造成測序數據量的極大浪費,同時也極易導致納米孔測序失敗,很難測到準確的端粒序列和真實的長度分布狀態,嚴重影響后續分析和解讀
。
[0005]此外,由于三代測序等長片段測序平臺的芯片孔數限制,常規建庫方法直接建庫很難測到端粒序列,很難通過加大數據量來彌補,因此測序時多在帶有接頭的文庫基礎上,使用設計的端粒特異性引物和文庫接頭上的另一條引物進行
PCR
擴增,進行端粒序列的富集,但因為提取時產生的斷點數量較多,還有大量的不完整端粒末端,造成富集效率較低,測到的端粒序列很少,無法有效進行端粒序列測定
。
另外,存在多個染色體末端序列未確定,也存在染色體的末端序列不能找到理想的引物序列,因此該方法也有局限,只能測定部分染色體的端粒序列,且其比例異常
。
[0006]目前仍需要一種用于完整或長片段端粒序列測序的接頭
、
預文庫及構建方法
。
技術實現思路
[0007]針對現有技術中存在的至少部分技術問題,專利技術人設計了一系列端粒特異性接頭,為端粒添加接頭時,能夠區分和富集完整端粒末端,并避免非完整末端被建庫
。
同時,本專利技術還設計了通用接頭,極大程度地阻止酶切形成的各類非完整端粒片段以及基因組背景碎片的擴增
。
具體地,本專利技術包括以下內容
。
[0008]本專利技術的第一方面,提供一種端粒特異性溫控錨定接頭,其包括引物結合區
、
單堿基重復區和端粒特異性錨定區,所述端粒特異性錨定區能夠與端粒3’
端懸臂的至少部分特
異性結合
。
[0009]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述單堿基重復區與所述端粒特異性錨定區兩部分的
Tm
值
(
本文有時也稱為
T1)
比所述單堿基重復區的
Tm
值
(
本文有時也稱為
T2)
高至少
5℃
以上
。
[0010]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述端粒特異性錨定區的長度為4?
10nt
,優選
6nt。
[0011]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述端粒特異性錨定區的序列能夠與重復單元為
TTAGGG
的序列特異性結合
。
[0012]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述端粒特異性錨定區的序列選自
CCCTAA、ACCCTA、AACCCT、CCTAAC、TAACCC
和
CTAACC
中的至少一種
。
[0013]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述單堿基重復區的
Tm
值
(
即
T2)
為
37℃
以下
。
[0014]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述單堿基重復區的長度為5?
20nt。
[0015]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述引物結合區對應的引物序列的
Tm(
即
T3)
值在
55℃
?
70℃
之間
。
[0016]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述引物為巢式
PCR
引物
。
[0017]在某些實施方案中,根據本專利技術所述的端粒特異性溫控錨定接頭,其中,所述引物結合區包含至少1條引物的結合區
。
[0018]本專利技術的第二方面,提供一種基因測序用預文庫構建試劑或試劑盒,其包含第一方面所述的端粒特異性溫控錨定接頭
。
[0019]在某些實施方案中,根據本專利技術所述的基因測序用預文庫構建試劑或試劑盒,其進一步包括通用接頭,其中所述通用接頭具有5’
端的磷酸化修飾,3’
端含有封閉基團
。
[0020]在某些實施方案中,根據本專利技術所述的基因測序用預文庫構建試劑或試劑盒,其中,所述封閉基團包括但不限于雙脫氧核苷
、
氨基
、
磷酸化基團和
C3/C6/C12 Spacer。
[0021]在某些實施方案中,根據本專利技術所述的基因測序用預文庫構建試劑或試劑盒,其中,所述通用接頭包含引物結合區
。
[0022]本專利技術的第三方面,提供一種針對人類完整端粒末端序列進行測序的預文庫構建方法,其包括以下步驟:
(1) 制備末端添加單堿基重復序列的樣本片段;
(2) 使所述樣本片段與本專利技術所述的端粒特異性溫控錨定接頭混合,在第一溫度下預變性,然后在第二溫度下雜交,其中,所述末端添加的單堿基重復序列與單堿基重復區的序列互補;
(3) 在第三溫度下利用聚合酶將接頭的3’
端延伸補平缺口,并將未與接頭互補的末端單堿本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.
一種端粒特異性溫控錨定接頭,其特征在于,包括引物結合區
、
單堿基重復區和端粒特異性錨定區,所述端粒特異性錨定區能夠與端粒3’
端懸臂的至少部分特異性結合
。2.
根據權利要求1所述的端粒特異性溫控錨定接頭,其特征在于,所述單堿基重復區與所述端粒特異性錨定區兩部分的
Tm
值比所述單堿基重復區的
Tm
值高至少
5℃。3.
根據權利要求1所述的端粒特異性溫控錨定接頭,其特征在于,所述單堿基重復區的
Tm
值為
37℃
以下
。4.
根據權利要求1所述的端粒特異性溫控錨定接頭,其特征在于,所述引物結合區對應的引物序列的
Tm
值在
55℃
?
70℃
之間
。5.
根據權利要求1所述的端粒特異性溫控錨定接頭,其特征在于,所述引物結合區包含至少1條引物的結合區
。6.
一種基因測序用預文庫構建試劑或試劑盒,其特征在于,包含根據權利要求1?5任一項所述的端粒特異性溫控錨定接頭
。7.
一種針對人類完整端粒末端序列進行測序的預文庫構建方法,其特征在于,包括以下步驟:
(1) 制備末端添加單堿基重復序列的樣本片段;
(2) 使所述樣本片段與根據權利要求1?5任一項所述的端粒特異性溫...
【專利技術屬性】
技術研發人員:紀鑫,倪守峰,王偉偉,田埂,
申請(專利權)人:元碼基因科技北京股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。