System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及生物制藥,特別涉及一種信使核糖核酸序列設計方法、裝置、計算設備及存儲介質。
技術介紹
1、信使核糖核酸(mrna)是一種單鏈分子,負責從脫氧核糖核酸(dna)傳遞遺傳信息到核糖體,核糖體再將遺傳信息解碼并合成蛋白質。近些年,經由體外轉錄(in?vitrotranscription,ivt)技術合成mrna的技術手段逐漸成熟。生物醫藥公司采用mrna技術平臺,使用具有靶向性、高效率、低免疫原性的遞送載體,可以將mrna遞送到人體內,人體細胞利用合成的mrna來表達特定的蛋白質。由于合成的mrna在結構上類似于天然mrna,使患者能夠在他們自己的身體中產生治療性蛋白質,從而減少在重組蛋白的復雜制造過程產生的各種困擾。基于mrna的療法的多樣性,新藥研發者使用合成mrna作為疾病治療工具,在研發癌癥免疫療法、基因治療以及控制傳染病上取得進展。mrna技術在疫苗研發上有著明顯的效率和保護力優勢。moderna公司和biontech公司均在一年內開發出mrna疫苗并上市,創造了歷史。
2、生物醫藥公司在設計mrna序列時往往不會直接采用野生型mrna序列,而是根據活性和成藥性需要對mrna序列進行優化設計。傳統的mrna序列設計方法通常只考慮進行密碼子優化,即采用人體細胞使用頻率較高的密碼子來優化編碼蛋白質的cds序列,從而使得合成mrna序列較野生型mrna序列獲得更高的可表達性。然而,這種只考慮密碼子使用頻率的設計方法由于缺少對物化性質的考慮,使得設計出的合成mrna分子不夠穩定,在體外容易發生降解,因此需要
3、針對上述問題,來自美國百度研究院的huang?liang等人于2020年提出了一種新的mrna序列設計的算法:linear?design。在這種算法里,合成mrna的cds區域優化被設定為一個多目標優化問題:即同時優化cds區域的最小自由能(mfe,minimum?free?energy)和密碼子使用效率(cai,codon?adaption?index)。通過定義一個打分函數s=mfecds+λ|p|(-logcaicds),linear?design將一條mrna序列的cds區域的最小自由能和密碼子使用效率進行同時優化,從而獲得兼具良好表達性和穩定性的合成mrna分子。然而,醫藥工業應用的合成mrna分子除了包括編碼蛋白的cds區域外,還包括非編碼區如5’utr和3’utr,這些非編碼區域對于mrna分子的表達和穩定性也有重要影響。
4、因此,目前亟需一種能夠將一條mrna序列的全長最小自由能和cds區域的密碼子使用效率進行同時優化的信使核糖核酸序列設計方法。
技術實現思路
1、本專利技術的目的在于提供一種信使核糖核酸序列設計方法、裝置、計算設備及存儲介質,能夠將一條mrna序列的全長最小自由能和cds區域的密碼子使用效率進行同時優化,保證了mrna序列的穩定性和可表達性。
2、為解決上述技術問題,本專利技術的實施方式公開了一種信使核糖核酸序列設計方法,包括以下步驟:
3、步驟s1:在給定的信使核糖核酸序列末尾分別添加編碼蛋白的第一個氨基酸對應的所有可能密碼子中的1個密碼子,生成一組初始序列,并將所述初始序列放入一個序列池中;其中,所述序列末尾只添加1個密碼子,并且每個密碼子只被添加一次;
4、步驟s2:判斷所述序列池中的序列數量是否大于搜索深度d;
5、若否,則執行步驟s3:在所述序列池中的所有序列末尾分別添加編碼蛋白的下一個氨基酸對應的所有可能密碼子中的1個密碼子,從而生成一組新序列,并返回執行步驟s2;其中,所述序列末尾只添加1個密碼子,并且每個密碼子只被添加一次;
6、若是,則執行步驟s4:計算所述序列池中的每條序列的全長最小自由能mfewhole和cds區域的密碼子使用效率caicds;
7、步驟s5:根據所述全長最小自由能mfewhole和所述cds區域的密碼子使用效率caicds,計算所述序列池中的每條序列的得分,并根據所述得分對所述序列池中的所有序列進行排序;
8、步驟s6:根據預設的過濾規則或者淘汰率,過濾所述序列池中不符合要求的序列或者淘汰所述序列池中排名靠后的序列,剩余保留序列;
9、步驟s7:根據所述搜索深度d,將所述保留序列聚類為d類,并將每一類中得分最高的序列保留在所述序列池中,淘汰其余序列;
10、步驟s8:判斷所述編碼蛋白的所有氨基酸對應的密碼子是否都被添加完畢;
11、若否,則返回執行步驟s3;若是,則執行步驟s9:在所述序列池中的所有序列末尾分別添加3’utr序列;
12、步驟s10:計算所述序列池中添加3’utr序列后的每條序列的全長最小自由能mfewhole和cds區域的密碼子使用效率caicds;
13、步驟s11:根據所述全長最小自由能mfewhole和所述cds區域的密碼子使用效率caicds,計算所述序列池中添加3’utr序列后的每條序列的得分,并根據所述得分對所述序列池中添加3’utr序列后的所有序列進行排序;
14、步驟s12:根據推選序列的數量r,將所述序列池中添加3’utr序列后的所有序列聚類為r類,并將每一類中得分最高的序列推薦為設計的信使核糖核酸序列。
15、本專利技術的實施方式還公開了一種使核糖核酸序列設計裝置,包括:
16、第一序列生成單元,用于在給定的信使核糖核酸序列末尾分別添加編碼蛋白的第一個氨基酸對應的所有可能密碼子中的1個密碼子,生成一組初始序列,并將所述初始序列放入一個序列池中;其中,所述序列末尾只添加1個密碼子,并且每個密碼子只被添加一次;
17、第一判斷單元,用于判斷所述序列池中的序列數量是否大于搜索深度d;
18、第二序列生成單元,用于在所述第一判斷單元判斷所述序列池中的序列數量不大于搜索深度d時,在所述序列池中的所有序列末尾分別添加編碼蛋白的下一個氨基酸對應的所有可能密碼子中的1個密碼子,從而生成一組新序列;其中,所述序列末尾只添加1個密碼子,并且每個密碼子只被添加一次;
19、第一計算單元,用于在所述第一判斷單元判斷所述序列池中的序列數量大于搜索深度d時,計算所述序列池中的每條序列的全長最小自由能mfewhole和cds區域的密碼子使用效率caicds;
20、第二計算單元,用于根據所述第一計算單元輸出的所述全長最小自由能mfewhole和所述cds區域的密碼子使用效率caicds,計算所述序列池中的每條序列的得分,并根據所述得分對所述序列池中的所有序列進行排序;
21、過濾單元,用于根據預設的過濾規則或者淘汰率,過濾所述序列池中不符合要求的序列或者淘汰所述序列池中排名靠后的序列,剩余保留序列;
22、第一聚類單元,用于根據所述搜索深度d,將所述保留序列聚類為d類,并將每一類中得分本文檔來自技高網...
【技術保護點】
1.一種信使核糖核酸序列設計方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,所述序列的得分為整體序列的所述全長最小自由能MFEwhole與所述CDS區域的密碼子使用效率CAICDS的加權和,所述序列的得分的公式表示為:
3.根據權利要求2所述的方法,其特征在于,所述序列的得分的公式進一步表示為:
4.根據權利要求2或3所述的方法,其特征在于,所述K的取值范圍為[0,+∞]。
5.根據權利要求1所述的方法,其特征在于,在所述步驟S1中,所述給定的信使核糖核酸序列為5'UTR序列。
6.根據權利要求1所述的方法,其特征在于,所述編碼蛋白的一個氨基酸對應的所有可能密碼子的數量為1-6個。
7.根據權利要求1所述的方法,其特征在于,所述搜索深度D為50、100、200和500中的任一個。
8.一種信使核糖核酸序列設計裝置,其特征在于,包括:
9.一種信使核糖核酸序列設計計算設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀
...【技術特征摘要】
1.一種信使核糖核酸序列設計方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,所述序列的得分為整體序列的所述全長最小自由能mfewhole與所述cds區域的密碼子使用效率caicds的加權和,所述序列的得分的公式表示為:
3.根據權利要求2所述的方法,其特征在于,所述序列的得分的公式進一步表示為:
4.根據權利要求2或3所述的方法,其特征在于,所述k的取值范圍為[0,+∞]。
5.根據權利要求1所述的方法,其特征在于,在所述步驟s1中,所述給定的信使核糖核酸序列為5'utr序列...
【專利技術屬性】
技術研發人員:黃韜,
申請(專利權)人:深圳智藥信息科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。