一種限定性模體的發(fā)現(xiàn)方法技術

技術編號：12294824 閱讀：93 留言：0更新日期：2015-11-11 06:54

本發(fā)明專利技術公開了一種限定性模體的發(fā)現(xiàn)方法，涉及生物信息領域，包括以下步驟：1)構(gòu)建字典表，所構(gòu)述字典表用于存儲指定模式P的模式實例；2)在字典表中以字典順序列出指定模式P的所有實例集合I＝{I1…IN}，其中，Ii為模體實例；3)對每個模體實例Ii與待檢測的核苷酸序列進行比較驗證，若第i個實例滿足只出現(xiàn)在待檢測的核苷酸正例序列集合中，而不出現(xiàn)在反例序列集合中，則該實例作為最終滿足條件的模體輸出。本發(fā)明專利技術以簡單的方法解決了限定性模體發(fā)現(xiàn)問題，最后的實驗證明，在合理的時間內(nèi)，倒排索引算法總是可以找到所有滿足條件的模體，從而保證了算法的有效性。

全部詳細技術資料下載

【技術實現(xiàn)步驟摘要】

本專利技術涉及生物信息
，尤其涉及。
技術介紹
模體（Motif)是指一組序列中局部的保守區(qū)域，或者是一組序列中共有的一小段序列模式。更多的時候是指有可能具有與分子功能、結(jié)構(gòu)性質(zhì)或家族成員相關的任何序列模式，其主要存在于蛋白質(zhì)、DNA、RNA等序列中。模體的發(fā)現(xiàn)對研究基因表達意義重大，是后基因時代生物信息學中的一個主要研究方向。目前模體發(fā)現(xiàn)問題研究主要集中于轉(zhuǎn)錄因子結(jié)合位點，即在DNA序列中具有特定功能并且保守的序列片段。而對限制性內(nèi)切酶結(jié)合位點的發(fā)現(xiàn)問題同樣是模體發(fā)現(xiàn)研究領域中的一個重要研究點。與前者不同，后者則是加入了一些限定條件。限制性內(nèi)切酶結(jié)合位點挖掘問題是指給定正例和反例核苷酸序列集合，并指定模式P，要求找到符合模式P的模體m，且只在正例序列集合中有模體實例存在，而在反例序列集合中不能出現(xiàn)模體m的實例。在這個過程中核苷酸序列的反向互補序列也要考慮進去，因此這類問題可以看作是一種帶有限定性條件的模體發(fā)現(xiàn)問題。此類帶限定性條件的模體的發(fā)現(xiàn)可以推斷出新的限制性內(nèi)切酶，進而可以針對不同外源DNA使用相應的內(nèi) 切酶破壞其DNA結(jié)構(gòu)以限制其侵入，從而起到了保護細胞原有的遺傳信息的作用。雖然目前在轉(zhuǎn)錄因子結(jié)合位點研究領域已經(jīng)出現(xiàn)了很多算法和相應的軟件，如 MEME、AlignACE、Gibbs Sampler、PMS系列等。這些算法中，多數(shù)算法及其改進算法可以很好地解決模體發(fā)現(xiàn)問題，但這些算法并不能直接用于尋找?guī)в邢薅ㄐ缘哪ｓw發(fā)現(xiàn)問題。
技術實現(xiàn)思路
針對上述缺陷或不足，本專利技術的目的在于提供，能夠獲取帶有限定...
一種限定性模體的發(fā)現(xiàn)方法

【技術保護點】
一種限定性模體的發(fā)現(xiàn)方法，其特征在于，包括以下步驟：1)構(gòu)建字典表，所述字典表用以存儲指定模式P的所有模式實例；2)在字典列中以字典順序列出指定模式P的所有實例集合I＝{I1…IN)，其中，Ii為模體實例；3)對每個模體實例Ii(1≤i≤N)與待檢測的核苷酸序列進行比較驗證，若第i個實例滿足只出現(xiàn)在待檢測的核苷酸正例序列集合中，而不出現(xiàn)在反例序列集合中，則該實例作為最終所要得到的模體輸出。

【技術特征摘要】

【專利技術屬性】
技術研發(fā)人員：吳剛，王國仁，林克青，李梁，劉洪偉，
申請(專利權(quán))人：東北大學，
類型：發(fā)明
國別省市：遼寧;21

全部詳細技術資料下載我是這個專利的主人

相關技術

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關領域技術