System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于分子生物醫(yī)學(xué),具體涉及一種確定生物體病狀的基因標(biāo)志物、檢測(cè)模型的構(gòu)建方法和檢測(cè)裝置。
技術(shù)介紹
1、游離脫氧核糖核酸(cfdna)尤其是血漿游離脫氧核糖核酸,它是由生物體內(nèi)多種組織脫落構(gòu)成,并通過(guò)非隨機(jī)過(guò)程產(chǎn)生的,可以作為一種非侵入性生物標(biāo)志物,便捷且準(zhǔn)確地用于生物體生理和病理狀況的診斷。
2、具體地可以利用游離脫氧核糖核酸(cfdna)的突變,拷貝數(shù)變異,甲基化和片段特征來(lái)進(jìn)行生物體生理和病理的診斷。其中片段特征主要包括全基因組各區(qū)域不同長(zhǎng)度的比例和片段末端序列偏好性,而游離脫氧核糖核酸(cfdna)片段末端序列偏好性可能和核酸酶的活性相關(guān)。從機(jī)制上講,發(fā)生了生理改變或者患病(比如惡性腫瘤患者)的游離脫氧核糖核酸(cfdna)片段末端序列偏好性變化的原因之一是不同核酸酶活性的變化。
3、目前用于游離脫氧核糖核酸(cfdna)片段末端序列分析的建庫(kù)實(shí)驗(yàn)的末端修復(fù)過(guò)程中,去除3’端突出的堿基,補(bǔ)齊3’端缺少的堿基,這樣原始的3’端信息被修改,而5’端信息得到保存。因此游離脫氧核糖核酸(cfdna)片段末端序列的研究只有被稱為“5’endmotif”的5’端固定長(zhǎng)度堿基序列集合和被稱為“breakpoint?motif”的根據(jù)5’端斷點(diǎn)處上下游若干bp的固定長(zhǎng)度堿基序列集合。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述問(wèn)題,本專利技術(shù)提供一種確定生物體病狀的基因標(biāo)志物、檢測(cè)模型的構(gòu)建方法和檢測(cè)裝置。本專利技術(shù)首次發(fā)現(xiàn)3’end?motif頻率在良性血漿樣本和不
2、本專利技術(shù)的技術(shù)方案為:
3、在本專利技術(shù)的第一方面,提供了一種確定生物體病狀的基因標(biāo)志物,所述標(biāo)志物是由參考基因組上的k個(gè)連續(xù)的堿基序列構(gòu)成,所述堿基序列是由游離脫氧核糖核酸(cfdna)的5’端斷點(diǎn)處比對(duì)至參考基因組上的位置向上游間隔n個(gè)bp后延長(zhǎng)k個(gè)bp而獲得的3’endmotif的堿基序列集合。
4、在另一優(yōu)選例中,n為任意自然數(shù),優(yōu)選的,n=0。
5、在另一優(yōu)選例中,n選自下組的任一自然數(shù):0、1、2、3、4、5、6、7、8、9、10。
6、在另一優(yōu)選例中,k為任意正整數(shù),優(yōu)選的,k=4。
7、在另一優(yōu)選例中,k選自下組的任一正整數(shù):0、1、2、3、4、5、6、7、8、9、10。
8、在另一優(yōu)選例中,當(dāng)n=0且k=4時(shí),所述3’end?motif的堿基序列集合包括如下代號(hào)為d1~d126的堿基序列的集合:
9、
10、
11、在另一優(yōu)選例中,當(dāng)n=0且k=4時(shí),所述3’end?motif的堿基序列集合為如下表a中代號(hào)為d1~d126的堿基序列的集合:
12、表a
13、
14、
15、在專利技術(shù)的第二方面,提供了所述基因標(biāo)志物在癌癥早篩中的應(yīng)用。
16、在一個(gè)優(yōu)選的方面,本專利技術(shù)提供了本專利技術(shù)第一方面所述基因標(biāo)志物、或其檢測(cè)試劑的用途,用于制備診斷試劑或診斷試劑盒,所述診斷試劑或診斷試劑盒用于癌癥早篩。
17、在另一優(yōu)選例中,所述癌癥選自下組:胃癌、乳腺癌、結(jié)直腸癌、膽管癌、中樞或周圍神經(jīng)系統(tǒng)組織癌、內(nèi)分泌或神經(jīng)內(nèi)分泌系統(tǒng)癌癥或造血系統(tǒng)癌癥、膠質(zhì)瘤、肉瘤、上皮癌、淋巴瘤、黑素瘤、纖維瘤、腦脊膜瘤、腦癌、腎癌、甲狀腺癌、甲狀旁腺癌、垂體瘤、腎上腺瘤、骨源性肉瘤腫瘤、神經(jīng)內(nèi)分泌系統(tǒng)腫瘤、肺癌、頭頸癌、前列腺癌、食管癌、氣管癌、肝癌、膀胱癌、胰腺癌、卵巢癌、子宮癌、宮頸癌、睪丸癌、皮膚癌、或其組合。
18、在另一優(yōu)選例中,所述癌癥選自下組:胃癌、乳腺癌、結(jié)直腸癌、膽管癌、或其組合。
19、在另一優(yōu)選例中,所述癌癥早篩的判斷如下:
20、當(dāng)所述基因標(biāo)志物是上調(diào)的標(biāo)志物時(shí),并且其在待測(cè)樣品中上調(diào)時(shí),則提示所述待測(cè)樣品對(duì)應(yīng)的待測(cè)對(duì)象患有癌癥的風(fēng)險(xiǎn)高;和
21、當(dāng)所述基因標(biāo)志物是下調(diào)的標(biāo)志物時(shí),并且其在待測(cè)樣品中下調(diào)時(shí),則提示待測(cè)樣品對(duì)應(yīng)的待測(cè)對(duì)象患有癌癥的風(fēng)險(xiǎn)高。
22、在核酸酶對(duì)核酸進(jìn)行水解過(guò)程中,一條核酸被水解成2條或者多條。那么一個(gè)脫氧核糖核酸(dna)片段的5’端向上游(5’端方向)延長(zhǎng)的堿基序列對(duì)應(yīng)著上游脫氧核糖核酸dna片段的3’端堿基序列,進(jìn)而本申請(qǐng)專利技術(shù)人把游離脫氧核糖核酸(cfdna)5’端向上游延長(zhǎng)一定長(zhǎng)度的堿基序列集合定義為游離脫氧核糖核酸(cfdna)的3’end?motif,其中也包括間隔n個(gè)bp后向上游延長(zhǎng)一定長(zhǎng)度的堿基序列集合。
23、考慮到不同的核酸酶對(duì)核酸的水解表現(xiàn)出不同的偏好,因此推斷游離脫氧核糖核酸(cfdna)片段3’端固定長(zhǎng)度堿基序列集合即3’end?motif變化也將體現(xiàn)出不同核酸酶活性的變化,成為癌癥早篩和診斷新的生物標(biāo)志物,與5’end?motif和breakpoint?motif一起完善游離脫氧核糖核酸(cfdna)片段末端序列特征體系。
24、在本專利技術(shù)的第三方面,提供了一種癌癥早篩檢測(cè)模型的構(gòu)建方法,包括如下步驟:
25、(1)對(duì)陽(yáng)性組和對(duì)照組的樣本分別進(jìn)行游離脫氧核糖核酸(cfdna)的提取建庫(kù)并測(cè)序,獲得讀段數(shù)據(jù);
26、(2)將所述讀段數(shù)據(jù)比對(duì)至參考基因組,得到讀段的5’端在參考基因組上的位置;
27、(3)根據(jù)所述讀段的5’端在參考基因組上的位置,向上游間隔n個(gè)bp堿基后延長(zhǎng)k個(gè)bp堿基,獲得的序列數(shù)據(jù)作為3’end?motif的堿基序列集合;
28、(4)統(tǒng)計(jì)出所述堿基序列集合中每個(gè)堿基序列在全部片段中所占比例,獲得每個(gè)堿基序列的頻率,篩選出陽(yáng)性組和對(duì)照組樣本中頻率具有顯著性差異的堿基序列;
29、(5)以步驟(4)所得的具有顯著性差異的堿基序列在全部片段中所占比例作為分類器模型的輸入值,以患有癌癥的風(fēng)險(xiǎn)作為輸出值,采用陽(yáng)性組和對(duì)照組的樣本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練后,得到所述癌癥早篩模型。
30、在本專利技術(shù)的一個(gè)優(yōu)選的方面中,提供了一種癌癥早篩檢測(cè)模型的構(gòu)建方法,包括如下步驟:
31、(s1)提供第一數(shù)據(jù)集和第二數(shù)據(jù)集,所述第一數(shù)據(jù)集中包括癌癥陽(yáng)性組樣本中的3’end?motif的堿基序列數(shù)據(jù),和對(duì)照組樣本中的3’end?motif的堿基序列數(shù)據(jù);
32、所述第二數(shù)據(jù)集中包括癌癥陽(yáng)性組樣本中的3’end?motif的堿基序列數(shù)據(jù),和對(duì)照組樣本中的3’end?motif的堿基序列數(shù)據(jù);和
33、(s2)根據(jù)第一數(shù)據(jù)集中的數(shù)據(jù)構(gòu)建癌癥早篩檢測(cè)模型并在第二數(shù)據(jù)集上進(jìn)行驗(yàn)證,從而得到所述癌癥早篩檢測(cè)模型。
34本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種確定生物體病狀的基因標(biāo)志物,其特征在于,所述基因標(biāo)志物是由參考基因組上的k個(gè)連續(xù)的堿基序列構(gòu)成,所述堿基序列是由游離脫氧核糖核酸的5’端斷點(diǎn)處比對(duì)至參考基因組上的位置向上游間隔n個(gè)bp堿基后延長(zhǎng)k個(gè)bp而獲得的3’end?motif的堿基序列集合。
2.根據(jù)權(quán)利要求1所述的基因標(biāo)志物,其特征在于,n為任意自然數(shù),優(yōu)選的,n=0。
3.根據(jù)權(quán)利要求1所述的基因標(biāo)志物,其特征在于,k為任意正整數(shù),優(yōu)選的,k=4。
4.根據(jù)權(quán)利要求1所述的基因標(biāo)志物,其特征在于,當(dāng)n=0且k=4時(shí),所述3’end?motif的堿基序列集合包括如下代號(hào)為D1~D126的堿基序列的集合:
5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述基因標(biāo)志物、或其檢測(cè)試劑的用途,其特征在于,用于制備診斷試劑或診斷試劑盒,所述診斷試劑或診斷試劑盒用于癌癥早篩。
6.一種癌癥早篩檢測(cè)模型的構(gòu)建方法,其特征在于,包括如下步驟:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述3’end?motif的堿基序列數(shù)據(jù)通過(guò)以下步驟獲得:
8.根據(jù)權(quán)利要求6
9.一種計(jì)算機(jī)存儲(chǔ)設(shè)備,其特征在于,所述設(shè)備中存儲(chǔ)有根據(jù)權(quán)利要求6-8任一項(xiàng)所述方法構(gòu)建得到的癌癥早篩檢測(cè)模型的算法所對(duì)應(yīng)的計(jì)算機(jī)程序。
10.一種癌癥早篩檢測(cè)裝置,其特征在于,所述裝置包括:
...【技術(shù)特征摘要】
1.一種確定生物體病狀的基因標(biāo)志物,其特征在于,所述基因標(biāo)志物是由參考基因組上的k個(gè)連續(xù)的堿基序列構(gòu)成,所述堿基序列是由游離脫氧核糖核酸的5’端斷點(diǎn)處比對(duì)至參考基因組上的位置向上游間隔n個(gè)bp堿基后延長(zhǎng)k個(gè)bp而獲得的3’end?motif的堿基序列集合。
2.根據(jù)權(quán)利要求1所述的基因標(biāo)志物,其特征在于,n為任意自然數(shù),優(yōu)選的,n=0。
3.根據(jù)權(quán)利要求1所述的基因標(biāo)志物,其特征在于,k為任意正整數(shù),優(yōu)選的,k=4。
4.根據(jù)權(quán)利要求1所述的基因標(biāo)志物,其特征在于,當(dāng)n=0且k=4時(shí),所述3’end?motif的堿基序列集合包括如下代號(hào)為d1~d126的堿基序列的集合:
5.根據(jù)權(quán)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:林子奧,趙利利,
申請(qǐng)(專利權(quán))人:奧明星程杭州生物科技有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。