System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及生物分析領(lǐng)域,更具體地,涉及一種在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法、設(shè)備、介質(zhì)和程序產(chǎn)品。
技術(shù)介紹
1、在生物學(xué)中,轉(zhuǎn)錄過程是調(diào)節(jié)基因表達的關(guān)鍵步驟,對于控制細胞發(fā)育和命運至關(guān)重要;轉(zhuǎn)錄過程的異常可能導(dǎo)致嚴重的健康問題,包括遺傳性疾病和癌癥,例如,轉(zhuǎn)錄過程的錯誤可能導(dǎo)致錯誤的蛋白質(zhì)合成,進而影響蛋白質(zhì)的結(jié)構(gòu)和功能。轉(zhuǎn)錄是dna轉(zhuǎn)換為rna的過程,在該過程中,dna片段被復(fù)制成信使rna(mrna),轉(zhuǎn)錄決定在細胞中表達的基因,從而決定了細胞的類型和功能。例如,在肌肉細胞中,與肌肉收縮相關(guān)的基因會被轉(zhuǎn)錄,而在神經(jīng)細胞中,則可能表達與傳遞神經(jīng)信號相關(guān)的基因。
2、基因組調(diào)控元件是基因轉(zhuǎn)錄、表達和翻譯過程中的關(guān)鍵調(diào)控因子。在轉(zhuǎn)錄水平上,增強子、啟動子、啟動子側(cè)翼區(qū)域(pfr)、開放染色質(zhì)區(qū)域(ocr)和?ctcfbs(ccctc?結(jié)合因子)能夠與特定蛋白質(zhì)結(jié)合,例如轉(zhuǎn)錄因子(tf)和?ctcf,從而影響轉(zhuǎn)錄活性和調(diào)節(jié)基因功能。基因組調(diào)控元件的分子失調(diào)可能導(dǎo)致人類疾病,然而,這些元件的功能仍然知之甚少。先前的研究表明,基因組調(diào)控元件與絕大多數(shù)遺傳變異重疊,特別是單核苷酸多態(tài)性(snp),易導(dǎo)致異常調(diào)控并很可能調(diào)節(jié)疾病易感性,因此在基因轉(zhuǎn)錄層面剖析snp、靶基因調(diào)控元件和原始表型之間的系統(tǒng)調(diào)控至關(guān)重要。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。為此,本專利技術(shù)提供一種在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法、設(shè)備、介質(zhì)和程序產(chǎn)品;本
2、本申請第一方面公開一種在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,所述方法包括:101,獲取至少一個待測snp;102,基于snp調(diào)取ref和alt序列對;103,提取所述序列對與ref和alt序列結(jié)合的調(diào)控蛋白質(zhì)數(shù)量;104,計算ref序列結(jié)合的蛋白質(zhì)數(shù)量記做numref,計算alt序列結(jié)合的蛋白質(zhì)數(shù)量記做numalt;105,根據(jù)所述numref和numalt的比值評價snp對蛋白質(zhì)結(jié)合效率的影響。
3、在一些實施例中,所述105包括:如果所述比值不等于第一閾值,輸出待測snp影響蛋白質(zhì)結(jié)合效率的評價結(jié)果;所述待測snp記做第一snp。
4、在一些實施例中,所述105包括:如果所述比值大于第一閾值,輸出待測snp影響蛋白質(zhì)結(jié)合效率低的評價結(jié)果;所述待測snp記做第二snp;如果所述比值小于第一閾值,輸出待測snp影響蛋白質(zhì)結(jié)合效率高的評價結(jié)果;所述待測snp記做第三snp。
5、在一些實施例中,所述方法還包括:106,從所述數(shù)個序列對內(nèi)篩選位于轉(zhuǎn)錄基因調(diào)控元件上結(jié)合基序的序列對;107,根據(jù)結(jié)合基序的位置信息計算僅與ref序列重疊的結(jié)合基序數(shù)量a和不與ref序列重疊的結(jié)合基序數(shù)量b的第一比例,計算僅與alt序列重疊的結(jié)合基序的數(shù)量c和不與alt序列重疊的結(jié)合基序的數(shù)量d的第二比例;根據(jù)第一比例和第二比例計算得到蛋白質(zhì)結(jié)合基序的變化值;篩選所述變化值小于第二閾值的snp作為第四snp,輸出第四snp影響蛋白質(zhì)結(jié)合效率的評價結(jié)果。
6、在一些實施例中,所述方法還包括:取所述第一snp與所述第四snp之間的交集,輸出交集中的snp影響蛋白質(zhì)結(jié)合效率的評價結(jié)果。
7、在一些實施例中,所述方法還包括:取所述第二snp與所述第四snp之間的交集,輸出交集中的snp的蛋白質(zhì)結(jié)合效率低的預(yù)測結(jié)果;取所述第三snp與所述第四snp之間的交集,輸出交集中的snp的蛋白質(zhì)結(jié)合效率高的預(yù)測結(jié)果。
8、在一些實施例中,所述基因調(diào)控元件包括:增強子、開放染色質(zhì)區(qū)域、啟動子、啟動子側(cè)翼區(qū)域;所述調(diào)控蛋白質(zhì)包括轉(zhuǎn)錄因子和ctcfs。
9、本申請第二方面公開一種計算機設(shè)備,所述設(shè)備包括:存儲器和處理器;所述存儲器用于存儲計算機程序;所述處理器執(zhí)行所述計算機程序以實現(xiàn)上述方法的步驟。
10、本申請第三方面公開一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的方法的步驟。
11、本申請第四方面公開一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)上述的方法的步驟。
12、本申請具有以下有益效果:1、本申請創(chuàng)新性的公開一種在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,該方法基于snp調(diào)取ref和alt序列對,并基于序列對中與ref和alt序列對結(jié)合的調(diào)控蛋白質(zhì)數(shù)量進行計算得到fc值,根據(jù)fc值給出snp對蛋白質(zhì)結(jié)合效率的評價結(jié)果。進一步地,還根據(jù)fc值的大小給出snp對蛋白質(zhì)結(jié)合效率影響高或低的量化結(jié)果。更進一步地,本申請還根據(jù)僅與或不與ref和alt序列重疊的結(jié)合基序數(shù)量計算pt值,根據(jù)fc值和pt值之間的關(guān)系進一步篩選影響蛋白質(zhì)結(jié)合效率高低。通過此種方式能夠更好地剖析snp在轉(zhuǎn)錄層面與蛋白質(zhì)結(jié)合的關(guān)系,提升對基因水平分子調(diào)控層面的理解。
13、2、本申請創(chuàng)新性的開發(fā)新的基因組定位方式,篩選位于轉(zhuǎn)錄基因調(diào)控元件上結(jié)合基序的序列對,摒棄現(xiàn)有數(shù)據(jù)庫中只定位到基因組的宏觀定位方式,相比較現(xiàn)有數(shù)據(jù)庫中只定位到基因組沒有定位到基因組調(diào)控元件的定位方式,本申請中的定位方式更加微觀、精確、準確,對于后續(xù)分析和評價的結(jié)果也更加準確。
本文檔來自技高網(wǎng)...【技術(shù)保護點】
1.一種在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述105包括:如果所述比值不等于第一閾值,輸出待測SNP影響蛋白質(zhì)結(jié)合效率的評價結(jié)果;所述待測SNP記做第一SNP。
3.根據(jù)權(quán)利要求2所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述105包括:如果所述比值大于第一閾值,輸出待測SNP影響蛋白質(zhì)結(jié)合效率低的評價結(jié)果;所述待測SNP記做第二SNP;如果所述比值小于第一閾值,輸出待測SNP影響蛋白質(zhì)結(jié)合效率高的評價結(jié)果;所述待測SNP記做第三SNP。
4.根據(jù)權(quán)利要求3所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述方法還包括:106,從所述數(shù)個序列對內(nèi)篩選位于轉(zhuǎn)錄基因調(diào)控元件上結(jié)合基序的序列對;107,根據(jù)結(jié)合基序的位置信息計算僅與Ref序列重疊的結(jié)合基序數(shù)量a和不與Ref序列重疊的結(jié)合基序數(shù)量b的第一比例,計算僅與Alt序列重疊的結(jié)合基序的數(shù)量c和不與Alt序列重疊的結(jié)合基序的數(shù)量d的第二比例;根據(jù)第一比例和第二比
5.根據(jù)權(quán)利要求4所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述方法還包括:取所述第一SNP與所述第四SNP之間的交集,輸出交集中的SNP影響蛋白質(zhì)結(jié)合效率的評價結(jié)果。
6.根據(jù)權(quán)利要求4所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述方法還包括:取所述第二SNP與所述第四SNP之間的交集,輸出交集中的SNP的蛋白質(zhì)結(jié)合效率低的預(yù)測結(jié)果;取所述第三SNP與所述第四SNP之間的交集,輸出交集中的SNP的蛋白質(zhì)結(jié)合效率高的預(yù)測結(jié)果。
7.根據(jù)權(quán)利要求1所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述基因調(diào)控元件包括:增強子、開放染色質(zhì)區(qū)域、啟動子、啟動子側(cè)翼區(qū)域;所述調(diào)控蛋白質(zhì)包括轉(zhuǎn)錄因子和CTCFs。
8.一種計算機設(shè)備,其特征在于,所述設(shè)備包括:存儲器和處理器;所述存儲器用于存儲計算機程序;所述處理器執(zhí)行所述計算機程序以實現(xiàn)權(quán)利要求1-7任一項所述的方法的步驟。
9.一種計算機可讀存儲介質(zhì),其特征在于,其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-7任意一項所述的方法的步驟。
10.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-7任意一項所述的方法的步驟。
...【技術(shù)特征摘要】
1.一種在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述105包括:如果所述比值不等于第一閾值,輸出待測snp影響蛋白質(zhì)結(jié)合效率的評價結(jié)果;所述待測snp記做第一snp。
3.根據(jù)權(quán)利要求2所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述105包括:如果所述比值大于第一閾值,輸出待測snp影響蛋白質(zhì)結(jié)合效率低的評價結(jié)果;所述待測snp記做第二snp;如果所述比值小于第一閾值,輸出待測snp影響蛋白質(zhì)結(jié)合效率高的評價結(jié)果;所述待測snp記做第三snp。
4.根據(jù)權(quán)利要求3所述的在基因轉(zhuǎn)錄水平評價蛋白質(zhì)結(jié)合效率的方法,其特征在于,所述方法還包括:106,從所述數(shù)個序列對內(nèi)篩選位于轉(zhuǎn)錄基因調(diào)控元件上結(jié)合基序的序列對;107,根據(jù)結(jié)合基序的位置信息計算僅與ref序列重疊的結(jié)合基序數(shù)量a和不與ref序列重疊的結(jié)合基序數(shù)量b的第一比例,計算僅與alt序列重疊的結(jié)合基序的數(shù)量c和不與alt序列重疊的結(jié)合基序的數(shù)量d的第二比例;根據(jù)第一比例和第二比例計算得到蛋白質(zhì)結(jié)合基序的變化值;篩選所述變化值小于第二閾值的snp作為第四snp,輸出第四snp影響蛋白質(zhì)結(jié)合效率的評價結(jié)果。
5...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王宏,徐良德,
申請(專利權(quán))人:溫州醫(yī)科大學(xué)附屬眼視光醫(yī)院,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。