System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及預(yù)測酶突變體活性,具體涉及一種預(yù)測酶突變體活性的方法。
技術(shù)介紹
1、在酶工程和蛋白質(zhì)設(shè)計中,預(yù)測酶突變體的活性變化是一個關(guān)鍵挑戰(zhàn)。現(xiàn)有方法通常依賴于分子動力學(xué)模擬或定量構(gòu)效關(guān)系模型,但這些方法在處理復(fù)雜的酶突變體時存在準確度不足和計算成本高的問題。機器學(xué)習方法近年來被引入該領(lǐng)域,然而,如何選擇適當?shù)奶卣鞑⒂行У貞?yīng)用于模型訓(xùn)練仍是一個開放性問題,如公開號為cn116884472a的中國專利公開一種抗菌肽抗菌活性預(yù)測方法,其通過將抗菌肽基因的內(nèi)在聯(lián)系考慮進去并通過改進預(yù)測模型解決了模型容易出現(xiàn)過擬合的問題和抗菌肽活性預(yù)測中部分標簽缺失的問題,但上述專利對于突變體活性變化的預(yù)測顯得力不從心。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)要解決的技術(shù)問題是:克服現(xiàn)有技術(shù)的不足,提供一種預(yù)測酶突變體活性的方法,此方法能夠顯著提高對突變體活性變化的預(yù)測準確度。
2、本專利技術(shù)的技術(shù)方案為:
3、一種預(yù)測酶突變體活性的方法,所述方法包括:
4、糖苷酶轉(zhuǎn)移酶數(shù)據(jù)輸入;
5、提取影響糖苷酶轉(zhuǎn)移酶活性的關(guān)鍵特征;
6、預(yù)定義氨基酸特性字典;
7、訓(xùn)練集和測試集劃分;
8、模型訓(xùn)練與優(yōu)化;
9、模型評估與驗證。
10、作為本專利技術(shù)的進一步方案,所述糖苷酶轉(zhuǎn)移酶數(shù)據(jù)輸入包括以下特征:活性口袋氨基酸位點變化、底物的三維體積特征。
11、作為本專利技術(shù)的進一步方案,所述氨基酸的特征提取包括
12、作為本專利技術(shù)的進一步方案,所述氨基酸特性字典存儲氨基酸的多種物理化學(xué)屬性,這些屬性包括疏水性、體積、極性。
13、作為本專利技術(shù)的進一步方案,所述底物體積計算利用rdkit工具計算,底物分子m的體積v(m)的計算公式如下:
14、
15、其中,表示分子中第i個原子的貢獻,n為分子的總原子數(shù)。
16、作為本專利技術(shù)的進一步方案,所述訓(xùn)練集和測試集劃分將數(shù)據(jù)集通過train_test_split函數(shù)隨機劃分為訓(xùn)練集和測試集。
17、作為本專利技術(shù)的進一步方案,所述模型選擇隨機森林模型。
18、本專利技術(shù)與現(xiàn)有技術(shù)相比,具有以下有益效果:
19、本專利技術(shù)提出了一種預(yù)測酶突變體活性的方法,該方法特別針對糖基轉(zhuǎn)移酶類酶突變體,通過使用特定的特征選擇,如氨基酸的疏水性變化、體積變化,以及底物的體積等特征,結(jié)合隨機森林算法,能夠顯著提高突變體活性預(yù)測的準確性,此方法可以用于篩選具有潛在應(yīng)用價值的酶突變體,以減少實驗篩選的工作量和成本。
本文檔來自技高網(wǎng)...【技術(shù)保護點】
1.一種預(yù)測酶突變體活性的方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述糖苷酶轉(zhuǎn)移酶數(shù)據(jù)輸入包括以下特征:活性口袋氨基酸位點變化、底物的三維體積特征。
3.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述氨基酸的特征提取包括活性口袋內(nèi)氨基酸的疏水性和體積變化以及底物體積的變化。
4.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述氨基酸特性字典存儲氨基酸的多種物理化學(xué)屬性,所述屬性包括疏水性、體積、極性。
5.如權(quán)利要求3所述的預(yù)測酶突變體活性的方法,其特征在于,所述底物體積的計算利用RDKit工具計算,底物分子M的體積V(M)的計算公式如下:
6.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述訓(xùn)練集和測試集劃分步驟將數(shù)據(jù)集通過train_test_split函數(shù)隨機劃分為訓(xùn)練集和測試集。
7.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述模型選擇隨機森林模型。
8.如權(quán)利要求1所述的預(yù)測酶突變體活性的方
9.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述模型評估與驗證,包括如下步驟:計算若干次驗證的平均性能,該平均值作為模型的最終評估結(jié)果。
...【技術(shù)特征摘要】
1.一種預(yù)測酶突變體活性的方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述糖苷酶轉(zhuǎn)移酶數(shù)據(jù)輸入包括以下特征:活性口袋氨基酸位點變化、底物的三維體積特征。
3.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述氨基酸的特征提取包括活性口袋內(nèi)氨基酸的疏水性和體積變化以及底物體積的變化。
4.如權(quán)利要求1所述的預(yù)測酶突變體活性的方法,其特征在于,所述氨基酸特性字典存儲氨基酸的多種物理化學(xué)屬性,所述屬性包括疏水性、體積、極性。
5.如權(quán)利要求3所述的預(yù)測酶突變體活性的方法,其特征在于,所述底物體積的計算利用rdkit...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:丁博青,陳良,張順斌,
申請(專利權(quán))人:青島奔月生物技術(shù)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。