System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及抗體設計,尤其涉及一種抗體序列的生成方法、裝置、電子設備及計算機程序產品。
技術介紹
1、抗體是一類重要的生物大分子,其在疾病診斷、治療和生物技術等領域有著廣泛的應用。設計和開發具有高親和力和特異性的抗體一直是生物醫藥領域的重要課題。傳統的抗體發現方法主要依賴于實驗篩選,效率低下且成本高昂。
2、近年來,隨著人工智能技術的發展,利用計算機輔助的方式設計和優化抗體序列成為可能。但是,現有的計算機輔助抗體設計方法存在一些不足。
3、例如,基于已知抗體序列作為模板的抗體設計方法,受限于已知抗體序列和結構的數量,設計空間有限。從頭設計抗體序列的方法往往需要耗費大量的計算資源,并且生成的序列質量參差不齊。
4、因此,如何提出一種新的基于人工智能的抗體序列的生成方法以提高抗體設計的效率和質量,是目前需要解決的問題。
技術實現思路
1、為解決或部分解決相關技術中存在的問題,本申請提供一種抗體序列的生成方法、裝置、電子設備及計算機程序產品,能夠高效自動且多樣化地生成具有高度人源性且與目標抗原高親合的目標抗體序列,提高設計效率,降低研發成本。
2、本申請第一方面提供一種抗體序列的生成方法,包括:
3、獲取目標抗原的抗原信息;
4、根據所述目標抗原的抗原信息,獲取對應的模板抗體序列;其中,所述模板抗體序列的預設區域具有掩碼標記;
5、根據預設語言模型,分別預測所述預設區域各位點對應的殘基種類概率,及根據預設決
6、根據所述預設區域各位點的所述殘基采樣方式及所述殘基種類概率,生成所述目標抗原對應的候選抗體序列;
7、將所述候選抗體序列的預設區域進行掩碼,并通過所述預設語言模型進行迭代優化,篩選獲得目標抗體序列。
8、一些實施方式中,所述獲取對應的模板抗體序列,包括:
9、當所述目標抗原具有可供結合的樣本抗體序列時,獲取與所述樣本抗體序列相似或相同的模板抗體序列;其中,在所述模板抗體序列的預設區域保留所述樣本抗體序列的熱點殘基或熱點基序;和/或當所述目標抗原不具有可供結合的樣本抗體序列時,在預先構建的人源抗體數據庫中選擇預設數量的模板抗體序列。
10、一些實施方式中,所述根據預設決策模型,分別確定所述模板抗體序列的預設區域各位點對應的殘基采樣方式,包括:
11、根據預設決策模型,分別獲得所述模板抗體序列的預設區域的各位點對應的決策分值;當對應的所述決策分值超過預設閾值時,確定所述位點為殘基固定采樣;當對應的所述決策分值未超過預設閾值時,確定所述位點為殘基隨機采樣。
12、一些實施方式中,所述根據所述預設區域各位點的所述殘基采樣方式及所述殘基種類概率,生成所述目標抗原對應的候選抗體序列,包括:
13、當所述預設區域的單個位點為殘基固定采樣時,將殘基種類概率最高的殘基作為對應位點的固定殘基;當所述預設區域的單個位點為殘基隨機采樣時,將殘基種類概率最高的多種殘基分別作為對應位點的隨機殘基;將模板抗體序列中對應位點的所述固定殘基分別與各對應位點的所述隨機殘基進行組合,生成所述目標抗原對應的候選抗體序列。
14、一些實施方式中,所述將所述候選抗體序列的預設區域進行掩碼,并通過所述預設語言模型進行迭代優化,包括:
15、獲取首輪所述候選抗體序列與所述目標抗體的親和力評估結果;將親和力評估結果更優的多個候選抗體序列的預設區域進行掩碼,獲得掩碼候選序列;根據所述預設語言模型,預測所述掩碼候選序列在預設區域各位點對應的殘基種類概率;根據所述模板抗體序列的殘基采樣方式和所述掩碼候選序列的殘基種類概率,迭代對應生成每一輪的候選抗體序列,直至末輪的候選抗體序列的親和力評估結果達到收斂。
16、一些實施方式中,所述篩選獲得目標抗體序列,包括:
17、根據各輪生成的候選抗體序列與所述目標抗原的親和力評估結果進行排序,篩選親和力評估結果更優的多個候選抗體序列作為目標抗體序列。
18、一些實施方式中,所述預設語言模型根據人源抗體數據庫的人源抗體序列進行隨機位點掩碼和位點殘基預測,構建獲得預訓練好的預設語言模型;其中,所述人源抗體序列的掩碼位點占殘基總數的15%~20%,所述人源抗體序列的預設區域的位點占所述掩碼位點總數的50%以上。
19、本申請第二方面提供一種抗體序列的生成裝置,其包括:
20、抗原獲取模塊,用于獲取目標抗原的抗原信息;
21、模板處理模塊,用于根據所述目標抗原的抗原信息,獲取對應的模板抗體序列;其中,所述模板抗體序列的預設區域具有掩碼標記;
22、殘基預測模塊,用于根據預設語言模型,分別預測所述預設區域各位點對應的殘基種類概率;
23、采樣決策模塊,用于根據預設決策模型,分別確定所述模板抗體序列的預設區域各位點對應的殘基采樣方式;
24、候選抗體生成模塊,用于根據所述預設區域各位點的所述殘基采樣方式及所述殘基種類概率,生成所述目標抗原對應的候選抗體序列;
25、迭代優化模塊,用于將所述候選抗體序列的預設區域進行掩碼,并通過所述預設語言模型進行迭代優化,篩選獲得目標抗體序列。
26、本申請第三方面提供一種電子設備,包括:
27、處理器;以及
28、存儲器,其上存儲有可執行代碼,當所述可執行代碼被所述處理器執行時,使所述處理器執行如上所述的方法。
29、本申請第四方面提供一種計算機可讀存儲介質,其上存儲有可執行代碼,當所述可執行代碼被電子設備的處理器執行時,使所述處理器執行如上所述的方法。
30、本申請第五方面提供一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序用于執行如上方法對應的計算機程序代碼指令。
31、本申請提供的技術方案可以包括以下有益效果:
32、本申請的抗體序列的生成方法,基于預設語言模型對模板抗體序列的掩碼位點進行殘基種類預測,使模板抗體序列的預設區域基于預設決策模型采樣優勢殘基,生成更合理的候選抗體序列,提高序列質量;同時,再經預設語言模型對候選抗體序列進行掩碼迭代,在多輪優化中生成更多可供選擇的候選抗體序列,繼而從中篩選出更優勢地目標抗體序列,滿足藥物發現的需求。
33、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本申請。
本文檔來自技高網...【技術保護點】
1.一種抗體序列的生成方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取對應的模板抗體序列,包括:
3.根據權利要求1所述的方法,其特征在于,所述根據預設決策模型,分別確定所述模板抗體序列的預設區域各位點對應的殘基采樣方式,包括:
4.根據權利要求3所述的方法,其特征在于,所述根據所述預設區域各位點的所述殘基采樣方式及所述殘基種類概率,生成所述目標抗原對應的候選抗體序列,包括:
5.根據權利要求1所述的方法,其特征在于,所述將所述候選抗體序列的預設區域進行掩碼,并通過所述預設語言模型進行迭代優化,包括:
6.根據權利要求1所述的方法,其特征在于,所述篩選獲得目標抗體序列,包括:
7.一種抗體序列的生成裝置,其特征在于,包括:
8.一種電子設備,其特征在于,包括:
9.一種計算機可讀存儲介質,其上存儲有可執行代碼,當所述可執行代碼被電子設備的處理器執行時,使所述處理器執行如權利要求1-7中任一項所述的方法。
10.一種計算機程序產品,包括計算機程序,
...【技術特征摘要】
1.一種抗體序列的生成方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取對應的模板抗體序列,包括:
3.根據權利要求1所述的方法,其特征在于,所述根據預設決策模型,分別確定所述模板抗體序列的預設區域各位點對應的殘基采樣方式,包括:
4.根據權利要求3所述的方法,其特征在于,所述根據所述預設區域各位點的所述殘基采樣方式及所述殘基種類概率,生成所述目標抗原對應的候選抗體序列,包括:
5.根據權利要求1所述的方法,其特征在于,所述將所述候選抗體序列的預設區域進行掩碼,并通過所述...
【專利技術屬性】
技術研發人員:王天元,龔朝輝,范學哲,黃小魯,
申請(專利權)人:科邁生物科技蘇州有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。