• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法技術(shù)方案

    技術(shù)編號(hào):15501135 閱讀:164 留言:0更新日期:2017-06-03 22:38
    本發(fā)明專利技術(shù)涉及一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法。用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的方法包含:搜索第一基因樣本序列中的特定變異區(qū)域以及搜索第二基因樣本序列中的另一特定變異區(qū)域;判斷特定變異區(qū)域與另一特定變異區(qū)域是否存在相同的一跨檢體子序列;當(dāng)特定變異區(qū)域與另一特定變異區(qū)域存在相同的跨檢體子序列時(shí),儲(chǔ)存跨檢體子序列至記錄表中;當(dāng)存在跨檢體子序列時(shí),將跨檢體子序列與一數(shù)據(jù)庫(kù)模塊中的多個(gè)已知菌種基因序列進(jìn)行比對(duì),以分析該第一基因樣本序列與第二基因樣本序列中對(duì)應(yīng)跨檢體子序列的菌種。由此減少測(cè)序數(shù)據(jù)的系統(tǒng)的運(yùn)算量,以達(dá)到提升分析檢體數(shù)據(jù)速度的功效。

    System and method for analyzing sequence data of bacterial strains

    The present invention relates to a system and method for analyzing sequencing data of bacterial strains. Method for analysis of bacteria sequencing data including: search the first gene sequence in the sample area and specific variant second gene sequence of samples in search of another specific regional variation; determine the specific range of variation with a specific range of variation is whether there is a cross subject sub sequence of the same; when there is cross check the same sub body the specific sequence variation region and another specific regional variation, cross sample sequence to store records in a table; when there is cross specimen sub sequence, to compare the cross subject sequence with a database module in a number of known species gene sequences, to analyze the corresponding cross specimen sequence the first sample sequence and second strains gene gene sequence sample. Thereby, the amount of computation of the system of the sequenced data is reduced so as to enhance the efficiency of analyzing the speed of the sample data.

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法
    本專利技術(shù)涉及一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法,且特別是涉及一種針對(duì)單一檢體及跨檢體重復(fù)序列進(jìn)行檢測(cè)的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法。
    技術(shù)介紹
    隨著生物科技的日益發(fā)展,基因測(cè)序的工作越來(lái)越完整,對(duì)于人體共生菌的研究變得非常重要。目前已知人體身上約100兆的共生菌所組成,這些共生菌的數(shù)量比人體全部的細(xì)胞整整多了十倍。此外,人體的腸胃道、皮膚、口腔、呼吸道、生殖道等等地方也有共生菌的存在,統(tǒng)稱為菌相,這些菌相與免疫、代謝、發(fā)育,神經(jīng)系統(tǒng)等等皆息息相關(guān)。其中,科學(xué)家們已知利用16S核糖體RNA(16SrRNA)序列的測(cè)序,解構(gòu)出人類腸道菌的種類分布,因此可利用將16SrRNA基因標(biāo)定并擴(kuò)增復(fù)制序列后,經(jīng)過(guò)測(cè)序及根據(jù)測(cè)序的質(zhì)量做前處理,再將序列與16SrRNA數(shù)據(jù)庫(kù)做組序、貼序的步驟,以區(qū)分出物種。而相似性高的物種將會(huì)歸類到同一個(gè)可操作性的分類單位體(operationaltaxonomicunit,OTU),最后統(tǒng)計(jì)分析不同檢體的菌向差異。然而,在傳統(tǒng)上,若要分析多組檢體數(shù)據(jù),則需要耗費(fèi)的時(shí)程及運(yùn)算量是相當(dāng)可觀的,因此如何減少系統(tǒng)的運(yùn)算量,以提升分析檢體數(shù)據(jù)的速度,已成為本領(lǐng)域需要解決的問(wèn)題之一。
    技術(shù)實(shí)現(xiàn)思路
    為解決上述的問(wèn)題,本專利技術(shù)的一個(gè)方面提供一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)。用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)包含:?jiǎn)我粰z體去重復(fù)序列模塊、跨檢體重復(fù)序列判斷模塊、重復(fù)序列記錄模塊以及運(yùn)算貼序模塊。單一檢體去重復(fù)序列模塊用以搜索第一基因樣本序列中的第一保守區(qū)域及特定變異區(qū)域,并將第一保守區(qū)域移除。跨檢體重復(fù)序列判斷模塊用以判斷特定變異區(qū)域是否存在與第二基因序列中的另一特定變異區(qū)域相同的跨檢體子序列。重復(fù)序列記錄模塊用以當(dāng)特定變異區(qū)域存在與第二菌體樣本中的另一特定變異區(qū)域相同的跨檢體子序列時(shí),儲(chǔ)存跨檢體子序列至記錄表中。運(yùn)算貼序模塊用以當(dāng)存在跨檢體子序列時(shí),將跨檢體子序列與數(shù)據(jù)庫(kù)模塊中的多個(gè)已知菌種基因序列進(jìn)行比對(duì),以分析第一基因樣本序列與第二基因樣本序列中對(duì)應(yīng)跨檢體子序列的菌種。本專利技術(shù)的另一方面提供一種用以分析細(xì)菌菌種的測(cè)序方法。分析細(xì)菌菌種的測(cè)序方法包含:搜索第一基因樣本序列中的特定變異區(qū)域以及搜索第二基因樣本序列中的另一特定變異區(qū)域;判斷特定變異區(qū)域與另一特定變異區(qū)域是否存在相同的跨檢體子序列;當(dāng)特定變異區(qū)域與另一特定變異區(qū)域存在相同的跨檢體子序列時(shí),儲(chǔ)存跨檢體子序列至記錄表中;當(dāng)存在跨檢體子序列時(shí),將跨檢體子序列與數(shù)據(jù)庫(kù)模塊中的多個(gè)已知菌種基因序列進(jìn)行比對(duì),以分析該第一基因樣本序列與第二基因樣本序列中對(duì)應(yīng)跨檢體子序列的菌種。綜上所述,本專利技術(shù)的技術(shù)方案與現(xiàn)有技術(shù)相比具有明顯的優(yōu)點(diǎn)和有益效果。通過(guò)上述技術(shù)方案,可達(dá)到相當(dāng)?shù)募夹g(shù)進(jìn)步,并具有產(chǎn)業(yè)上的廣泛利用價(jià)值,本公開(kāi)內(nèi)容可減少用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)的運(yùn)算量,以達(dá)到提升分析檢體數(shù)據(jù)速度的功效。附圖說(shuō)明為了使本專利技術(shù)的上述和其他目的、特征、優(yōu)點(diǎn)與實(shí)施例能更明顯易懂,提供附圖如下:圖1是根據(jù)本專利技術(shù)一實(shí)施例繪示的一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)的方塊圖;圖2是根據(jù)本專利技術(shù)一實(shí)施例繪示的一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的方法的流程圖;圖3是根據(jù)本專利技術(shù)一實(shí)施例繪示的一種基因樣本序列的示意圖;圖4A-4C是根據(jù)本專利技術(shù)一實(shí)施例繪示的一種基因片段的示意圖。具體實(shí)施方式參照第1圖,圖1是根據(jù)本專利技術(shù)一實(shí)施例繪示的一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)100的方塊圖。用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)100包含:?jiǎn)我粰z體去重復(fù)序列模塊110、跨檢體重復(fù)序列判斷模塊120、重復(fù)序列記錄模塊130以及運(yùn)算貼序模塊140。單一檢體去重復(fù)序列模塊110用以搜索第一基因樣本序列中的第一保守區(qū)域及特定變異區(qū)域,并將第一保守區(qū)域移除??鐧z體重復(fù)序列判斷模塊120用以判斷特定變異區(qū)域是否存在與第二基因序列中的另一特定變異區(qū)域相同的一跨檢體子序列。重復(fù)序列記錄模塊130用以當(dāng)特定變異區(qū)域存在與第二菌體樣本中的另一特定變異區(qū)域相同的跨檢體子序列時(shí),儲(chǔ)存跨檢體子序列至一記錄表135中。運(yùn)算貼序模塊140用以當(dāng)存在跨檢體子序列時(shí),將跨檢體子序列與一數(shù)據(jù)庫(kù)模塊150中的多個(gè)已知菌種基因序列進(jìn)行比對(duì),以分析第一基因樣本序列與第二基因樣本序列中對(duì)應(yīng)跨檢體子序列的菌種。其中,如圖1所示,數(shù)據(jù)庫(kù)模塊150可被實(shí)作為只讀存儲(chǔ)器、閃存、軟盤、硬盤、光盤、隨身碟、磁帶、可由網(wǎng)絡(luò)存取的數(shù)據(jù)庫(kù)或本領(lǐng)域技術(shù)人員可輕易思及具有相同功能的儲(chǔ)存介質(zhì),記錄表135可以為一檔案,被儲(chǔ)存于具有儲(chǔ)存功能的任何電子裝置中。此外,單一檢體去重復(fù)序列模塊110、跨檢體重復(fù)序列判斷模塊120、重復(fù)序列記錄模塊130以及運(yùn)算貼序模塊140可分別或合并被實(shí)施為例如微控制單元(microcontroller)、微處理器(microprocessor)、數(shù)字信號(hào)處理器(digitalsignalprocessor)、特殊應(yīng)用集成電路(applicationspecificintegratedcircuit,ASIC)或邏輯電路。由上述可知,用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)100可排除單一檢體中相同或重復(fù)的基因區(qū)段,并通過(guò)跨檢體地找出相同或重復(fù)的跨檢體子序列,將跨檢體子序列及其與菌體樣本之間的關(guān)系儲(chǔ)存至記錄表135中,利用記錄表135可將大量具有重復(fù)性質(zhì)的跨檢體子序列建立精簡(jiǎn)化的數(shù)據(jù)結(jié)構(gòu)。通過(guò)此些方法可避免運(yùn)算貼序模塊140重復(fù)地將單一檢體或跨檢體中相同或重復(fù)的大量基因區(qū)段與數(shù)據(jù)庫(kù)模塊150中的已知數(shù)據(jù)進(jìn)行比對(duì),更可減少用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)100的運(yùn)算量,以提升分析檢體數(shù)據(jù)的速度。以下進(jìn)一步說(shuō)明分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的方法200。一并參照?qǐng)D1-3,圖2是根據(jù)本專利技術(shù)一實(shí)施例繪示的一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的方法200的流程圖。圖3是根據(jù)本專利技術(shù)的一實(shí)施例繪示的一種基因樣本序列300的示意圖。為了方便說(shuō)明,圖1所示的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)100的操作會(huì)與用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的方法200及基因樣本序列300一并舉例說(shuō)明。在步驟S210中,單一檢體去重復(fù)序列模塊110用以搜索第一基因樣本序列中的特定變異區(qū)域以及搜索第二基因樣本序列中的另一特定變異區(qū)域。于一實(shí)施例中,第一基因樣本序列中的特定變異區(qū)域以及第二基因樣本序列中的另一特定變異區(qū)域可以分別指第一基因樣本序列和第二基因樣本序列中的任一段變異區(qū)域。于一實(shí)施例中,用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)還包含檢體采樣模塊(未繪示)及基因測(cè)序模塊(未繪示)。檢體采樣模塊用以采樣多個(gè)菌體樣本,此些菌體樣本包含第一菌體樣本及第二菌體樣本?;驕y(cè)序模塊用以將此些菌體樣本分別進(jìn)行基因測(cè)序,以取得對(duì)應(yīng)第一菌體樣本的第一基因樣本序列,及對(duì)應(yīng)第二菌體樣本的第二基因樣本序列。舉例而言,于某一使用者進(jìn)行大腸鏡檢查時(shí),可能會(huì)發(fā)現(xiàn)其大腸長(zhǎng)有息肉,則檢體采樣模塊可將息肉部份進(jìn)行采樣,并在息肉的附近看起來(lái)正常的地方也進(jìn)行采樣,以取得多個(gè)菌體樣本。其中,每一份菌體樣本可能具有30萬(wàn)筆基因數(shù)據(jù),此些數(shù)據(jù)中通?;祀s了多種對(duì)人體有害或有益的多種細(xì)菌,因此可通過(guò)將此些基因樣本序列分別與數(shù)據(jù)庫(kù)模塊150中的已知數(shù)據(jù)進(jìn)行比對(duì),當(dāng)比本文檔來(lái)自技高網(wǎng)...
    用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法

    【技術(shù)保護(hù)點(diǎn)】
    一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其特征在于包含:?jiǎn)我粰z體去重復(fù)序列模塊,用以搜索第一基因樣本序列中的第一保守區(qū)域及一特定變異區(qū)域,并將該第一保守區(qū)域移除;跨檢體重復(fù)序列判斷模塊,用以判斷該特定變異區(qū)域是否存在與第二基因序列中的另一特定變異區(qū)域相同的一跨檢體子序列;重復(fù)序列記錄模塊,當(dāng)該特定變異區(qū)域存在與該第二菌體樣本中的該另一特定變異區(qū)域相同的該跨檢體子序列時(shí),該重復(fù)序列記錄模塊用以儲(chǔ)存該跨檢體子序列至一記錄表中;運(yùn)算貼序模塊,當(dāng)存在該跨檢體子序列時(shí),該運(yùn)算貼序模塊用以將該跨檢體子序列與數(shù)據(jù)庫(kù)模塊中的多個(gè)已知菌種基因序列進(jìn)行比對(duì),以分析該第一基因樣本序列與該第二基因樣本序列中對(duì)應(yīng)該跨檢體子序列的菌種。

    【技術(shù)特征摘要】
    2015.11.20 TW 1041385051.一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其特征在于包含:?jiǎn)我粰z體去重復(fù)序列模塊,用以搜索第一基因樣本序列中的第一保守區(qū)域及一特定變異區(qū)域,并將該第一保守區(qū)域移除;跨檢體重復(fù)序列判斷模塊,用以判斷該特定變異區(qū)域是否存在與第二基因序列中的另一特定變異區(qū)域相同的一跨檢體子序列;重復(fù)序列記錄模塊,當(dāng)該特定變異區(qū)域存在與該第二菌體樣本中的該另一特定變異區(qū)域相同的該跨檢體子序列時(shí),該重復(fù)序列記錄模塊用以儲(chǔ)存該跨檢體子序列至一記錄表中;運(yùn)算貼序模塊,當(dāng)存在該跨檢體子序列時(shí),該運(yùn)算貼序模塊用以將該跨檢體子序列與數(shù)據(jù)庫(kù)模塊中的多個(gè)已知菌種基因序列進(jìn)行比對(duì),以分析該第一基因樣本序列與該第二基因樣本序列中對(duì)應(yīng)該跨檢體子序列的菌種。2.根據(jù)權(quán)利要求1所述的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),還包含:檢體采樣模塊,用以采樣多個(gè)菌體樣本,該些菌體樣本包含第一菌體樣本及第二菌體樣本;以及基因測(cè)序模塊,用以將該些菌體樣本分別進(jìn)行基因測(cè)序,以取得對(duì)應(yīng)該第一菌體樣本的第一基因樣本序列,及對(duì)應(yīng)該第二菌體樣本的第二基因樣本序列。3.根據(jù)權(quán)利要求2所述的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其中,該重復(fù)序列記錄模塊更用以記錄該跨檢體子序列所對(duì)應(yīng)的該另一特定變異區(qū)域、該跨檢體子序列所對(duì)應(yīng)的該另一特定變異區(qū)域的所屬的該第二菌體樣本。4.根據(jù)權(quán)利要求1所述的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其中,該第一基因樣本序列包含第一基因片段及第二基因片段,其中,當(dāng)該第一基因片段與該第二基因片段完全相同時(shí),該單一檢體去重復(fù)序列模塊將該第二基因片段視為至少第一保守區(qū)域的其中之一,該特定變異區(qū)域排除該第二基因片段;以及該運(yùn)算貼序模塊將該第一基因片段與該數(shù)據(jù)庫(kù)模塊中的該些已知菌種基因序列進(jìn)行比對(duì),以分析對(duì)應(yīng)該第一基因片段的菌種。5.根據(jù)權(quán)利要求1所述的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其中,該第一基因樣本序列包含第一基因片段及第二基因片段,當(dāng)該第一基因...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:鄭佳揚(yáng),徐仁徽劉韋驛,蔡孟勳,盧子彬,賴亮全莊曜宇,
    申請(qǐng)(專利權(quán))人:財(cái)團(tuán)法人資訊工業(yè)策進(jìn)會(huì)
    類型:發(fā)明
    國(guó)別省市:中國(guó)臺(tái)灣,71

    網(wǎng)友詢問(wèn)留言 已有0條評(píng)論
    • 還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 亚洲免费日韩无码系列| 免费无码黄十八禁网站在线观看 | 中文字幕无码av激情不卡久久| 日韩乱码人妻无码中文视频| 亚洲AV综合色区无码一二三区| 西西午夜无码大胆啪啪国模| 成人免费一区二区无码视频| 亚洲日韩精品无码专区加勒比 | 一本大道无码日韩精品影视 | 亚洲AV无码之日韩精品| 少妇精品无码一区二区三区| 国产乱人无码伦av在线a| 久久无码一区二区三区少妇| 亚洲人成无码网WWW| 性生交片免费无码看人| 无码AV中文一区二区三区| 最新国产AV无码专区亚洲| 免费人妻av无码专区| 久久久久久国产精品无码下载 | 在线观看无码的免费网站| 永久免费av无码不卡在线观看 | 亚洲精品无码久久千人斩| 亚洲午夜无码片在线观看影院猛| 亚洲av无码有乱码在线观看| 亚洲视频无码高清在线| 中字无码av电影在线观看网站| 无码专区—VA亚洲V天堂| 亚洲动漫精品无码av天堂| 久久午夜无码鲁丝片| 免费无码AV电影在线观看| 亚洲精品自偷自拍无码| 亚洲AV无码国产精品永久一区| 精品欧洲av无码一区二区14| 日韩激情无码免费毛片| 亚洲成在人线在线播放无码| 亚洲av无码一区二区三区四区 | 亚洲人成人无码网www电影首页| 日韩精品无码免费专区午夜 | 亚洲AV无码国产一区二区三区| 亚洲精品无码人妻无码| 粉嫩大学生无套内射无码卡视频 |