The present invention relates to a system and method for analyzing sequencing data of bacterial strains. Method for analysis of bacteria sequencing data including: search the first gene sequence in the sample area and specific variant second gene sequence of samples in search of another specific regional variation; determine the specific range of variation with a specific range of variation is whether there is a cross subject sub sequence of the same; when there is cross check the same sub body the specific sequence variation region and another specific regional variation, cross sample sequence to store records in a table; when there is cross specimen sub sequence, to compare the cross subject sequence with a database module in a number of known species gene sequences, to analyze the corresponding cross specimen sequence the first sample sequence and second strains gene gene sequence sample. Thereby, the amount of computation of the system of the sequenced data is reduced so as to enhance the efficiency of analyzing the speed of the sample data.
【技術(shù)實(shí)現(xiàn)步驟摘要】
用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法
本專利技術(shù)涉及一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法,且特別是涉及一種針對(duì)單一檢體及跨檢體重復(fù)序列進(jìn)行檢測(cè)的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)及其方法。
技術(shù)介紹
隨著生物科技的日益發(fā)展,基因測(cè)序的工作越來(lái)越完整,對(duì)于人體共生菌的研究變得非常重要。目前已知人體身上約100兆的共生菌所組成,這些共生菌的數(shù)量比人體全部的細(xì)胞整整多了十倍。此外,人體的腸胃道、皮膚、口腔、呼吸道、生殖道等等地方也有共生菌的存在,統(tǒng)稱為菌相,這些菌相與免疫、代謝、發(fā)育,神經(jīng)系統(tǒng)等等皆息息相關(guān)。其中,科學(xué)家們已知利用16S核糖體RNA(16SrRNA)序列的測(cè)序,解構(gòu)出人類腸道菌的種類分布,因此可利用將16SrRNA基因標(biāo)定并擴(kuò)增復(fù)制序列后,經(jīng)過(guò)測(cè)序及根據(jù)測(cè)序的質(zhì)量做前處理,再將序列與16SrRNA數(shù)據(jù)庫(kù)做組序、貼序的步驟,以區(qū)分出物種。而相似性高的物種將會(huì)歸類到同一個(gè)可操作性的分類單位體(operationaltaxonomicunit,OTU),最后統(tǒng)計(jì)分析不同檢體的菌向差異。然而,在傳統(tǒng)上,若要分析多組檢體數(shù)據(jù),則需要耗費(fèi)的時(shí)程及運(yùn)算量是相當(dāng)可觀的,因此如何減少系統(tǒng)的運(yùn)算量,以提升分析檢體數(shù)據(jù)的速度,已成為本領(lǐng)域需要解決的問(wèn)題之一。
技術(shù)實(shí)現(xiàn)思路
為解決上述的問(wèn)題,本專利技術(shù)的一個(gè)方面提供一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)。用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng)包含:?jiǎn)我粰z體去重復(fù)序列模塊、跨檢體重復(fù)序列判斷模塊、重復(fù)序列記錄模塊以及運(yùn)算貼序模塊。單一檢體去重復(fù)序列模塊用以搜索第一基因樣本序列中的第一保守區(qū)域及特定變異區(qū)域,并將第一保守區(qū)域 ...
【技術(shù)保護(hù)點(diǎn)】
一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其特征在于包含:?jiǎn)我粰z體去重復(fù)序列模塊,用以搜索第一基因樣本序列中的第一保守區(qū)域及一特定變異區(qū)域,并將該第一保守區(qū)域移除;跨檢體重復(fù)序列判斷模塊,用以判斷該特定變異區(qū)域是否存在與第二基因序列中的另一特定變異區(qū)域相同的一跨檢體子序列;重復(fù)序列記錄模塊,當(dāng)該特定變異區(qū)域存在與該第二菌體樣本中的該另一特定變異區(qū)域相同的該跨檢體子序列時(shí),該重復(fù)序列記錄模塊用以儲(chǔ)存該跨檢體子序列至一記錄表中;運(yùn)算貼序模塊,當(dāng)存在該跨檢體子序列時(shí),該運(yùn)算貼序模塊用以將該跨檢體子序列與數(shù)據(jù)庫(kù)模塊中的多個(gè)已知菌種基因序列進(jìn)行比對(duì),以分析該第一基因樣本序列與該第二基因樣本序列中對(duì)應(yīng)該跨檢體子序列的菌種。
【技術(shù)特征摘要】
2015.11.20 TW 1041385051.一種用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其特征在于包含:?jiǎn)我粰z體去重復(fù)序列模塊,用以搜索第一基因樣本序列中的第一保守區(qū)域及一特定變異區(qū)域,并將該第一保守區(qū)域移除;跨檢體重復(fù)序列判斷模塊,用以判斷該特定變異區(qū)域是否存在與第二基因序列中的另一特定變異區(qū)域相同的一跨檢體子序列;重復(fù)序列記錄模塊,當(dāng)該特定變異區(qū)域存在與該第二菌體樣本中的該另一特定變異區(qū)域相同的該跨檢體子序列時(shí),該重復(fù)序列記錄模塊用以儲(chǔ)存該跨檢體子序列至一記錄表中;運(yùn)算貼序模塊,當(dāng)存在該跨檢體子序列時(shí),該運(yùn)算貼序模塊用以將該跨檢體子序列與數(shù)據(jù)庫(kù)模塊中的多個(gè)已知菌種基因序列進(jìn)行比對(duì),以分析該第一基因樣本序列與該第二基因樣本序列中對(duì)應(yīng)該跨檢體子序列的菌種。2.根據(jù)權(quán)利要求1所述的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),還包含:檢體采樣模塊,用以采樣多個(gè)菌體樣本,該些菌體樣本包含第一菌體樣本及第二菌體樣本;以及基因測(cè)序模塊,用以將該些菌體樣本分別進(jìn)行基因測(cè)序,以取得對(duì)應(yīng)該第一菌體樣本的第一基因樣本序列,及對(duì)應(yīng)該第二菌體樣本的第二基因樣本序列。3.根據(jù)權(quán)利要求2所述的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其中,該重復(fù)序列記錄模塊更用以記錄該跨檢體子序列所對(duì)應(yīng)的該另一特定變異區(qū)域、該跨檢體子序列所對(duì)應(yīng)的該另一特定變異區(qū)域的所屬的該第二菌體樣本。4.根據(jù)權(quán)利要求1所述的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其中,該第一基因樣本序列包含第一基因片段及第二基因片段,其中,當(dāng)該第一基因片段與該第二基因片段完全相同時(shí),該單一檢體去重復(fù)序列模塊將該第二基因片段視為至少第一保守區(qū)域的其中之一,該特定變異區(qū)域排除該第二基因片段;以及該運(yùn)算貼序模塊將該第一基因片段與該數(shù)據(jù)庫(kù)模塊中的該些已知菌種基因序列進(jìn)行比對(duì),以分析對(duì)應(yīng)該第一基因片段的菌種。5.根據(jù)權(quán)利要求1所述的用以分析細(xì)菌菌種的測(cè)序數(shù)據(jù)的系統(tǒng),其中,該第一基因樣本序列包含第一基因片段及第二基因片段,當(dāng)該第一基因...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:鄭佳揚(yáng),徐仁徽,劉韋驛,蔡孟勳,盧子彬,賴亮全,莊曜宇,
申請(qǐng)(專利權(quán))人:財(cái)團(tuán)法人資訊工業(yè)策進(jìn)會(huì),
類型:發(fā)明
國(guó)別省市:中國(guó)臺(tái)灣,71
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。