System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)涉及生物工程,更具體地說(shuō),本專(zhuān)利技術(shù)涉及一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法及系統(tǒng)。
技術(shù)介紹
1、生物積塊是一種標(biāo)準(zhǔn)化的基因片段或功能基因組,它們可以在生物工程中被重復(fù)使用和組裝,類(lèi)似于積木,生物積塊具有特定的dna序列和功能,例如編碼特定蛋白質(zhì)、酶或遺傳開(kāi)關(guān)等,由于缺乏關(guān)于生物積塊的信息數(shù)據(jù)庫(kù),限制了生物工程領(lǐng)域的標(biāo)準(zhǔn)化和規(guī)范化,可能導(dǎo)致設(shè)計(jì)的不一致性和可重復(fù)性問(wèn)題,這使得不同研究之間的比較和驗(yàn)證變得困難,導(dǎo)致研究人員和工程師可能無(wú)法獲取到其他人設(shè)計(jì)的生物積塊的信息,從而受限于現(xiàn)有的設(shè)計(jì)范式和思路,現(xiàn)有技術(shù)中,雖然出現(xiàn)了構(gòu)建基因數(shù)據(jù)庫(kù)的方法,但是還存在一定的缺陷;
2、例如,公開(kāi)號(hào)為cn1?10473594a的專(zhuān)利提供了病原微生物基因組數(shù)據(jù)庫(kù)及其建立方法,該專(zhuān)利雖然獲取了生物基因組數(shù)據(jù),并對(duì)生物基因組數(shù)據(jù)進(jìn)行篩選從而構(gòu)建基因數(shù)據(jù)庫(kù),但是沒(méi)有在構(gòu)建的過(guò)程中沒(méi)有考慮數(shù)據(jù)安全和隱私防護(hù),使得所構(gòu)建的基因數(shù)據(jù)庫(kù)容易泄漏,公開(kāi)號(hào)為cn1?10718272a的專(zhuān)利提供了基于基因序列與基因功能的非數(shù)值字段的加密及解密方法,雖然該專(zhuān)利進(jìn)行了加密工作,但是根據(jù)基因序列加密是較為常規(guī)的技術(shù),并沒(méi)有根據(jù)基因數(shù)據(jù)庫(kù)的特點(diǎn)進(jìn)行加密,使得構(gòu)建完成基因數(shù)據(jù)庫(kù)依舊存在數(shù)據(jù)安全方面的問(wèn)題。
3、鑒于此,本專(zhuān)利技術(shù)提出一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法及系統(tǒng)以解決上述問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本專(zhuān)利技術(shù)提供一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法及系統(tǒng)。
2、為實(shí)現(xiàn)上述目的,本專(zhuān)利技術(shù)提供如下技術(shù)方案:
3、一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,包括:
4、s10:獲取m個(gè)生物積塊的基因序列,根據(jù)m個(gè)基因序列所對(duì)應(yīng)的第一生物信息,將m個(gè)基因序列分為n個(gè)第一基因序列集合,所述第一生物信息為生物積塊所對(duì)應(yīng)的生物種類(lèi),m大于n;
5、s20:基于n個(gè)第一基因序列集合生成n個(gè)相對(duì)應(yīng)的加密字符串,通過(guò)數(shù)字隱寫(xiě)將加密字符串嵌入至所述第一基因序列集合中,獲得n個(gè)第二基因序列集合;
6、s30:基于n個(gè)第二基因序列集合所對(duì)應(yīng)的第二生物信息進(jìn)行聚類(lèi),獲得h個(gè)第三基因序列集合,所述第二生物信息為第二基因序列集合所對(duì)應(yīng)的生物種類(lèi),n大于h;
7、s40:基于h個(gè)第三基因序列集合構(gòu)建基因信息數(shù)據(jù)庫(kù)。
8、進(jìn)一步地,根據(jù)m個(gè)基因序列所對(duì)應(yīng)的第一生物信息,將m個(gè)基因序列分為n個(gè)第一基因序列集合的方法包括:
9、獲取m個(gè)基因序列所對(duì)應(yīng)的第一生物信息,遍歷m個(gè)基因序列,將第一生物信息相同的基因序列組合成第一基因序列集合,以此獲得n個(gè)第一基因序列集合。
10、進(jìn)一步地,基于n個(gè)第一基因序列集合生成n個(gè)相對(duì)應(yīng)的加密字符串的方法包括:
11、遍歷n個(gè)第一基因序列集合,獲取第一基因序列集合所對(duì)應(yīng)的第一生物信息,通過(guò)哈希函數(shù)生成相應(yīng)的加密字符串,生成n個(gè)相對(duì)應(yīng)的加密字符串。
12、進(jìn)一步地,通過(guò)數(shù)字隱寫(xiě)將加密字符串嵌入至所述第一基因序列集合中,獲得n個(gè)第二基因序列集合的方法包括:
13、遍歷n個(gè)第一基因序列集合所對(duì)應(yīng)的加密字符串,將加密字符串轉(zhuǎn)化為二進(jìn)制,將轉(zhuǎn)化后的加密字符串嵌入至對(duì)應(yīng)的第一基因序列集合的文件名末尾,以此獲得n個(gè)第二基因序列集合。
14、進(jìn)一步地,基于n個(gè)第二基因序列集合所對(duì)應(yīng)的第二生物信息進(jìn)行聚類(lèi),獲得h個(gè)第三基因序列集合的方法包括:
15、遍歷n個(gè)第二基因序列集合,計(jì)算n個(gè)第二基因序列集合之間的相似度,將相似度小于預(yù)設(shè)相似度閾值的第二基因序列集合進(jìn)行組合形成第三基因序列集合,以此獲得h個(gè)第三基因序列集合。
16、進(jìn)一步地,計(jì)算n個(gè)第二基因序列集合之間的相似度的方法包括:
17、通過(guò)編碼將n個(gè)第二基因序列集合中基因序列轉(zhuǎn)化為向量,計(jì)算第二基因序列集合對(duì)應(yīng)向量之間的歐氏距離,根據(jù)歐氏距離確定第二基因序列集合之間的相似度。
18、進(jìn)一步地,根據(jù)歐氏距離確定第二基因序列集合之間的相似度的方法包括:
19、
20、式中,slt為第二基因序列集合之間的相似度,ed為第二基因序列集合對(duì)應(yīng)向量之間的歐氏距離。
21、一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立系統(tǒng),其用于實(shí)現(xiàn)上述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,包括:
22、分類(lèi)模塊:用于獲取m個(gè)生物積塊的基因序列,根據(jù)m個(gè)基因序列所對(duì)應(yīng)的第一生物信息,將m個(gè)基因序列分為n個(gè)第一基因序列集合,所述第一生物信息為生物積塊所對(duì)應(yīng)的生物種類(lèi),m大于n;
23、加密模塊:用于基于n個(gè)第一基因序列集合生成n個(gè)相對(duì)應(yīng)的加密字符串,通過(guò)數(shù)字隱寫(xiě)將加密字符串嵌入至所述第一基因序列集合中,獲得n個(gè)第二基因序列集合;
24、聚合模塊:用于基于n個(gè)第二基因序列集合所對(duì)應(yīng)的第二生物信息進(jìn)行聚類(lèi),獲得h個(gè)第三基因序列集合,所述第二生物信息為第二基因序列集合所對(duì)應(yīng)的生物種類(lèi),n大于h;
25、構(gòu)建模塊:用于基于h個(gè)第三基因序列集合構(gòu)建基因信息數(shù)據(jù)庫(kù)。
26、一種電子設(shè)備,包括電源、接口、鍵盤(pán)、存儲(chǔ)器、中央處理器以及存儲(chǔ)在存儲(chǔ)器上并可在中央處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,所述接口包括網(wǎng)絡(luò)接口與數(shù)據(jù)接口,網(wǎng)絡(luò)接口包括有線(xiàn)或無(wú)線(xiàn)接口,數(shù)據(jù)接口包括輸入或輸出接口。
27、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被執(zhí)行時(shí)實(shí)現(xiàn)上述一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法。
28、相比于現(xiàn)有技術(shù),本專(zhuān)利技術(shù)的有益效果為:
29、本專(zhuān)利技術(shù)先是獲取m個(gè)生物積塊的基因序列,根據(jù)m個(gè)基因序列所對(duì)應(yīng)的第一生物信息,將m個(gè)基因序列分為n個(gè)第一基因序列集合,基于n個(gè)第一基因序列集合生成n個(gè)相對(duì)應(yīng)的加密字符串,通過(guò)數(shù)字隱寫(xiě)將加密字符串嵌入至所述第一基因序列集合中,獲得n個(gè)第二基因序列集合,基于n個(gè)第二基因序列集合所對(duì)應(yīng)的第二生物信息進(jìn)行聚類(lèi),獲得h個(gè)第三基因序列集合,最后基于h個(gè)第三基因序列集合構(gòu)建基因信息數(shù)據(jù)庫(kù),這樣根據(jù)基因數(shù)據(jù)庫(kù)的特點(diǎn)進(jìn)行加密,不僅保證了基因信息數(shù)據(jù)庫(kù)的安全性,還便于用戶(hù)進(jìn)行查閱,為研究人員和工程師提供便利。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述根據(jù)M個(gè)基因序列所對(duì)應(yīng)的第一生物信息,將M個(gè)基因序列分為N個(gè)第一基因序列集合的方法包括:
3.根據(jù)權(quán)利要求2所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述基于N個(gè)第一基因序列集合生成N個(gè)相對(duì)應(yīng)的加密字符串的方法包括:
4.根據(jù)權(quán)利要求3所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述通過(guò)數(shù)字隱寫(xiě)將加密字符串嵌入至所述第一基因序列集合中,獲得N個(gè)第二基因序列集合的方法包括:
5.根據(jù)權(quán)利要求1所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述基于N個(gè)第二基因序列集合所對(duì)應(yīng)的第二生物信息進(jìn)行聚類(lèi),獲得H個(gè)第三基因序列集合的方法包括:
6.根據(jù)權(quán)利要求5所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述計(jì)算N個(gè)第二基因序列集合之間的相似度的方法包括:
7.根據(jù)權(quán)利要求6所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述根據(jù)
8.一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立系統(tǒng),其用于實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,包括:
9.一種電子設(shè)備,包括電源、接口、鍵盤(pán)、存儲(chǔ)器、中央處理器以及存儲(chǔ)在存儲(chǔ)器上并可在中央處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述中央處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,所述接口包括網(wǎng)絡(luò)接口與數(shù)據(jù)接口,網(wǎng)絡(luò)接口包括有線(xiàn)或無(wú)線(xiàn)接口,數(shù)據(jù)接口包括輸入或輸出接口。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法。
...【技術(shù)特征摘要】
1.一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述根據(jù)m個(gè)基因序列所對(duì)應(yīng)的第一生物信息,將m個(gè)基因序列分為n個(gè)第一基因序列集合的方法包括:
3.根據(jù)權(quán)利要求2所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述基于n個(gè)第一基因序列集合生成n個(gè)相對(duì)應(yīng)的加密字符串的方法包括:
4.根據(jù)權(quán)利要求3所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述通過(guò)數(shù)字隱寫(xiě)將加密字符串嵌入至所述第一基因序列集合中,獲得n個(gè)第二基因序列集合的方法包括:
5.根據(jù)權(quán)利要求1所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述基于n個(gè)第二基因序列集合所對(duì)應(yīng)的第二生物信息進(jìn)行聚類(lèi),獲得h個(gè)第三基因序列集合的方法包括:
6.根據(jù)權(quán)利要求5所述的一種生物積塊的系統(tǒng)信息數(shù)據(jù)庫(kù)建立方法,其特征在于,所述計(jì)算n...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:何加銘,王欽文,金錱,吳東舒,單丹丹,江文玲,洪銳,鄭國(guó)俊,張濟(jì)鵬,余偉康,雷宣龍,
申請(qǐng)(專(zhuān)利權(quán))人:寧波甬恒瑤瑤智能科技有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。