• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當(dāng)前位置: 首頁 > 專利查詢>七橋基因公司專利>正文

    用于在有向非循環(huán)結(jié)構(gòu)中使用雙端數(shù)據(jù)的系統(tǒng)和方法技術(shù)方案

    技術(shù)編號:13470422 閱讀:45 留言:0更新日期:2016-08-05 03:14
    本申請涉及一種分析轉(zhuǎn)錄組的方法,該方法包括從來自生物體的轉(zhuǎn)錄組獲得至少一對雙端讀數(shù),找出在該對的第一讀數(shù)和有向非循環(huán)數(shù)據(jù)結(jié)構(gòu)(該數(shù)據(jù)結(jié)構(gòu)具有表示RNA序列諸如外顯子或轉(zhuǎn)錄本的節(jié)點(diǎn)和連接多對節(jié)點(diǎn)的邊緣)中的節(jié)點(diǎn)之間的具有最佳評分的比對,識別包含節(jié)點(diǎn)的候選路徑,該節(jié)點(diǎn)通過具有與該對雙端讀數(shù)的插入長度大體上類似的長度的路徑連接到下游節(jié)點(diǎn),并且將雙端讀數(shù)與候選路徑比對以確定最佳評分比對。

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    【國外來華專利技術(shù)】【專利摘要】本申請涉及一種分析轉(zhuǎn)錄組的方法,該方法包括從來自生物體的轉(zhuǎn)錄組獲得至少一對雙端讀數(shù),找出在該對的第一讀數(shù)和有向非循環(huán)數(shù)據(jù)結(jié)構(gòu)(該數(shù)據(jù)結(jié)構(gòu)具有表示RNA序列諸如外顯子或轉(zhuǎn)錄本的節(jié)點(diǎn)和連接多對節(jié)點(diǎn)的邊緣)中的節(jié)點(diǎn)之間的具有最佳評分的比對,識別包含節(jié)點(diǎn)的候選路徑,該節(jié)點(diǎn)通過具有與該對雙端讀數(shù)的插入長度大體上類似的長度的路徑連接到下游節(jié)點(diǎn),并且將雙端讀數(shù)與候選路徑比對以確定最佳評分比對。【專利說明】 相關(guān)申請的交叉參考 本申請要求2014年1月17日提交的美國專利申請序列號14/157,979的權(quán)益和優(yōu)先 權(quán),該美國專利申請要求2013年10月21日提交的美國臨時(shí)專利申請序列號61/893,467的權(quán) 益和優(yōu)先權(quán),該臨時(shí)專利申請的內(nèi)容W引用方式并入本文。 序列表 本申請包含已通過網(wǎng)絡(luò)電子提交系統(tǒng)化FS-Web)WASCII格式提交的序列表,并且 W其全部內(nèi)容W引用方式并入本文。2014年10月14日創(chuàng)建的ASCII格式化的序列表被命名 為 SBG-009-01W0-2-Sequences_ST25,并且大小為 1,217 字節(jié)。
    本專利技術(shù)大體上設(shè)及生物信息學(xué),并且尤其設(shè)及使用有向非循環(huán)數(shù)據(jù)結(jié)構(gòu)進(jìn)行分 析。
    技術(shù)介紹
    對于特定的發(fā)育階段或生理狀態(tài),轉(zhuǎn)錄組是細(xì)胞中完整的一組轉(zhuǎn)錄本和它們的數(shù) 量。轉(zhuǎn)錄組對生物體的功能、發(fā)育和疾病極為重要。生物體的本質(zhì)和活力來源于所有的轉(zhuǎn)錄 本(包含mRNA、非編碼RNA和小RNA)、它們的表達(dá)水平、基因剪接模式和轉(zhuǎn)錄后修飾。事實(shí)上, 人類基因組中與期望相比大得多的部分現(xiàn)在已知為被轉(zhuǎn)錄的。參見Bedone等人,2004,《具 有基因組嵌合陣列的人類轉(zhuǎn)錄序列的全局識別(Global identification of human transcribed sequences with genome tiling arrays)》,《科學(xué)(Science)》306:2242- 2246 〇 已經(jīng)報(bào)道基于下一代測序(NGS)技術(shù)的用于轉(zhuǎn)錄組分析的方法。參見,例如,Wang 等人,2009,《RNA測序:用于轉(zhuǎn)錄組學(xué)的革命性的工具(RNA-Seq: a revolutionary tool for transcriptomics)》,《遺傳學(xué)自然評論(化t Rev Genet)》10(l):57-63 2009eRNA測序 (將RNA測序)方法承諾快速生成高容量的轉(zhuǎn)錄組數(shù)據(jù)。[000引然而,RNA測序面臨信息挑戰(zhàn),諸如存儲和分析大量數(shù)據(jù),運(yùn)必須被解決W更好地 使用讀數(shù)。比對和分析RNA測序讀數(shù)不僅在設(shè)及的信息的本質(zhì)上呈現(xiàn)出問題,還在容量上呈 現(xiàn)出問題。具有大數(shù)據(jù)集的讀映射是計(jì)算上的挑戰(zhàn),并且用于差異表達(dá)的分析方法才開始 出現(xiàn)。參見Garber等人,2011,《使用RNA測序的用于轉(zhuǎn)錄組注釋和量化的計(jì)算方法 (Comput曰tion曰1 methods for tr曰nscriptome 曰nnot曰tion 曰nd qu曰ntific曰tion using RNA-Seq)》,《自然方法(化t Meth)》8(6):469-477。映射來自RNA測序的大量讀數(shù)的計(jì)算需 求被將來可獲得的大量參考數(shù)據(jù)大大倍增。例如,GENC0DE聯(lián)合體力圖識別已經(jīng)被報(bào)道的人類基因組中的所有基因特征。 Harrow等人,2012,《GENC0DE:用于編碼計(jì)劃的參考人類基因組注釋(GENC0DE: The reference human genome annotation for The ENCODE Project)》,《基因組石開究(Genome Res)》22:1760-1774。由GENCODE計(jì)劃包含的材料的量是龐大的。不僅僅要繼續(xù)添加新的蛋 白質(zhì)編碼基因位點(diǎn),而且經(jīng)注釋的可變剪接轉(zhuǎn)錄本的數(shù)量穩(wěn)定地增加 。GENCODE 7版本包含 超過20,000個(gè)蛋白質(zhì)-編碼和幾乎10,000個(gè)長的非編碼RNA基因位點(diǎn)(IncRNA),W及未在其 它源中展現(xiàn)的超過33,000個(gè)編碼轉(zhuǎn)錄本。GENCODE還包含其它特征諸如非轉(zhuǎn)錄區(qū)域(UTR)、 長基因間非編碼RNA(lincRNA)基因、短非編碼RNA和可變剪接模式。即使RNA測序研究開始 僅具有有限量的新數(shù)據(jù),來自源諸如GENCODE的潛在參考數(shù)據(jù)的容量也是如此大,使得理解 新數(shù)據(jù)在計(jì)算上是具有挑戰(zhàn)性的。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)大體上提供了用于使用組織為有向非循環(huán)圖(DAG)或類似的數(shù)據(jù)結(jié)構(gòu)的參 考對雙端讀數(shù)進(jìn)行分析的系統(tǒng)和方法。參考中的特征諸如外顯子和內(nèi)含子在DAG中提供節(jié) 點(diǎn),并且那些特征通過邊緣W它們的規(guī)范的基因順序彼此鏈接。DAG可W按比例繪制為任何 大小,并且事實(shí)上,在第一實(shí)例中可W被填入來自外來經(jīng)注釋的參考的導(dǎo)入序列。在新數(shù)據(jù) 包含雙端讀數(shù)的情況下,一對中的每個(gè)讀數(shù)可W潛在地沿長度L的基因組且在復(fù)雜的DAG中 與任何位置比對,可存在多得多的位置(即,平均來說,如果DAG是橫越任何基因位點(diǎn)η重的, 則比對一對雙端讀數(shù)相當(dāng)于從(nL)~2個(gè)選項(xiàng)中進(jìn)行選擇)。然而,插入長度信息提供了用于 將潛在的比對約束在DAG內(nèi)的手段一一不僅是在路徑內(nèi)遠(yuǎn)離的距離中,還通過排除路徑、將 選項(xiàng)的數(shù)量限制為相對于L是線性的。雙端讀數(shù)還可W提供其它信息。例如,雙端讀數(shù)可W 提供用于修飾DAG的基礎(chǔ),可W被用于推斷異構(gòu)體頻率、或者其它。事實(shí)上,具有插入長度信 息的雙端讀數(shù)集攜載信息的品質(zhì),該品質(zhì)非常適合于聚焦基于DAG的比對和更新DAGW表示 可能沒有被發(fā)現(xiàn)或注意到的實(shí)際上出現(xiàn)的固有異構(gòu)體。因此,雙端讀數(shù)特別適合于RNA測序 計(jì)劃,允許相對于很大的參考集分析很大的RNA測序數(shù)據(jù)集。使用雙端RNA測序讀數(shù)發(fā)現(xiàn)轉(zhuǎn) 錄組的所有的異構(gòu)體并不是計(jì)算上難處理的,并且轉(zhuǎn)錄組學(xué)可先前不可能的步伐和吞 吐量移動(dòng)。可W從一個(gè)或任何數(shù)量的生物體研究一個(gè)或任何數(shù)量的轉(zhuǎn)錄組W增加對生物體 功能、發(fā)育和疾病的理解。 本專利技術(shù)的某方面設(shè)及創(chuàng)建包含參考的特征(例如,外顯子、內(nèi)含子等)的DAG,參考 的特征W基因組順序通過它們的近端邊緣連接。該DAG數(shù)據(jù)結(jié)構(gòu)具有轉(zhuǎn)錄組學(xué)中的應(yīng)用,包 含例如識別異構(gòu)體。此DAG參考被用于設(shè)及包含配對讀數(shù)的RNA測序數(shù)據(jù)的轉(zhuǎn)錄組學(xué)中???W使用包含作為節(jié)點(diǎn)的特征(例如從經(jīng)注釋的源基因組或轉(zhuǎn)錄組創(chuàng)建的)的DAG參考來分析 RNA測序數(shù)據(jù)。本專利技術(shù)的系統(tǒng)和方法提供了使用雙端讀數(shù)的改進(jìn)的比對、使用雙端讀數(shù)信息 構(gòu)建DAG、推斷異構(gòu)體概率或頻率,或其組合。 在某些方面中,本專利技術(shù)提供了分析轉(zhuǎn)錄組的方法,該方法包括從來自生物體的轉(zhuǎn) 錄組獲得至少一對雙端讀數(shù),找出在該對的第一讀數(shù)和有向非循環(huán)數(shù)據(jù)結(jié)構(gòu)中的節(jié)點(diǎn)之間 的具有最佳評分的比對(該數(shù)據(jù)結(jié)構(gòu)具有表示RNA序列諸如外顯子或轉(zhuǎn)錄本的節(jié)點(diǎn)和連接 多對節(jié)點(diǎn)的邊緣),識別包含節(jié)點(diǎn)的候選路徑,該節(jié)點(diǎn)通過具有與該對雙端讀數(shù)的插入長度 大體上類似的長度的路徑連接到下游節(jié)點(diǎn),W及將雙端讀數(shù)與候選路徑比對W確定最佳評 分比對。方法可W包含從包括該對雙端讀數(shù)的任何比對計(jì)算中排除不是候選路徑的任何路 徑。 該方法適合于任何數(shù)量的雙端讀數(shù)。節(jié)點(diǎn)和下游節(jié)點(diǎn)可W表示一對外顯子,該對 雙端讀數(shù)從該對外顯子獲得。該方法可W包含基于所確定的最佳評分比對來識本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】
    一種分析轉(zhuǎn)錄組的方法,所述方法包括:從轉(zhuǎn)錄組獲得一對雙端讀數(shù);找出在所述對的第一讀數(shù)和有向非循環(huán)數(shù)據(jù)結(jié)構(gòu)中的節(jié)點(diǎn)之間的具有最佳評分的比對,所述數(shù)據(jù)結(jié)構(gòu)包括表示RNA序列的節(jié)點(diǎn)和連接多對所述節(jié)點(diǎn)的邊緣;識別包含所述節(jié)點(diǎn)的候選路徑,所述節(jié)點(diǎn)通過具有與所述一對雙端讀數(shù)的插入長度大體上類似的長度的路徑連接到下游節(jié)點(diǎn);以及將所述雙端讀數(shù)與所述候選路徑比對以確定最佳評分比對。

    【技術(shù)特征摘要】
    【國外來華專利技術(shù)】...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:丹尼斯·庫拉爾,南森·梅維斯,
    申請(專利權(quán))人:七橋基因公司,
    類型:發(fā)明
    國別省市:美國;US

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 国产怡春院无码一区二区| 内射精品无码中文字幕| 国模无码人体一区二区| 免费看无码特级毛片| 无码人妻精品一区二区三区东京热| 麻豆aⅴ精品无码一区二区| 无码国产69精品久久久久孕妇| 国产三级无码内射在线看| 影音先锋无码a∨男人资源站| 久久久久无码精品亚洲日韩| 无码无套少妇毛多69XXX| 久久久久久人妻无码| 永久免费av无码入口国语片| 99久无码中文字幕一本久道 | 寂寞少妇做spa按摩无码| 亚洲av无码一区二区三区观看| 亚洲精品无码专区2| 亚洲AV无码片一区二区三区| 无码GOGO大胆啪啪艺术| 亚洲av永久无码精品古装片| 影院无码人妻精品一区二区| 精品少妇人妻AV无码专区不卡| 亚洲国产日产无码精品| 亚洲Av综合色区无码专区桃色| 亚洲va中文字幕无码| 无码欧精品亚洲日韩一区夜夜嗨 | 永久无码精品三区在线4| 亚洲乱人伦中文字幕无码| 久久亚洲AV无码精品色午夜麻| 2014AV天堂无码一区| 亚洲中文字幕无码专区| 久青草无码视频在线观看| 人妻系列无码专区久久五月天 | 免费无码不卡视频在线观看| 亚洲精品无码久久久久久| 亚洲av无码专区青青草原| 亚洲日韩国产AV无码无码精品| 毛片免费全部播放无码| 67194成l人在线观看线路无码| AA区一区二区三无码精片| 亚洲av中文无码字幕色不卡 |