System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 人妻丰满av无码中文字幕,精品无码成人片一区二区98,免费无码黄十八禁网站在线观看
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于藥物預訓練模型的分子性質預測微調方法技術

    技術編號:44519844 閱讀:0 留言:0更新日期:2025-03-07 13:13
    本發明專利技術公開了一種基于藥物預訓練模型的分子性質預測微調方法,屬于藥物發現技術領域。所述方法在預訓練模型中引入頭部特征并行適配器,凍結預訓練模型的主干部分后,通過訓練頭部特征并行適配器和藥物分子性質預測網絡得到訓練好的特定分子性質預測模型;頭部特征并行適配器通過分割、適配和合并分子特征向量,實現對分子內部復雜化學空間的深入學習,適配器由全連接層和非線性激活函數組成,專注于優化分子特征表示,同時保持模型參數的效率,不僅提高了模型的性能,還加快了藥物發現的進程,降低了實驗成本,并且由于其廣泛的適用性,這些適配器可以推廣到材料科學和環境科學等多個領域,為相關領域的研究提供了一種高效且靈活的工具。

    【技術實現步驟摘要】

    本專利技術涉及一種基于藥物預訓練模型的分子性質預測微調方法,屬于藥物發現。


    技術介紹

    1、藥物發現是一個復雜且資源密集的過程,傳統方法依賴于實驗和臨床試驗,這些方法不僅耗時且成本高昂。隨著人工智能技術的發展,特別是深度學習在生物信息學領域的應用,為藥物發現帶來了新的可能性。預訓練模型,如graph?neural?networks、graphtransformer?networks和bert等,已經在藥物發現中顯示出巨大的潛力,它們能夠通過在未標記數據集上的泛化學習來獲取分子結構的全面表示。這些模型能夠預測從量子化學到生理學的多種分子屬性,并被用作特征編碼器。

    2、然而,這些大型網絡在微調下游任務時存在挑戰,因為它們需要為每個任務存儲和部署單獨的模型參數副本,這不僅成本高昂,而且往往不切實際。為了克服這些限制,研究人員提出了參數高效微調(parameter-efficient?fine-tuning,peft)方法。這些方法通過凍結背景網絡,并可能引入額外的可訓練參數,或者指定一組參數進行訓練,或者重新定義適應過程以提高效率。盡管這些peft方法在自然語言處理和計算機視覺任務中表現出色,但在藥物發現領域的應用卻鮮有研究。

    3、此外,現有的peft方法在藥物發現應用中面臨挑戰,因為它們采用一刀切的策略,將統一的參數整合到所有下游知識中。這種統一性雖然簡化了微調過程,但卻忽視了預訓練模型中固有的多面性知識和特定下游任務的多因素要求,導致模型在明確學習分子內部復雜化學空間方面的能力較弱。在藥物發現中,需要全面知識的任務非常普遍,而強大的解釋能力在該領域至關重要。目前,很少有研究致力于通過在微調過程中學習先驗知識和下游信息的各種方面來增強模型的解釋性和預測能力,這是一個具有挑戰性的任務。


    技術實現思路

    1、為了解決上述問題,本專利技術提供了一種基于藥物預訓練模型的分子性質預測微調方法,該方法特別適用于藥物發現領域,通過設計一種高度可解釋且性能優異的微調范式,即頭部特征并行適配器(head?feature?parallel?adapter,hfpa),以實現對預訓練模型的有效微調,所述技術方案如下:

    2、本專利技術的分子性質預測微調方法包括:在用于藥物分子性質預測的預訓練模型中引入頭部特征并行適配器,凍結所述預訓練模型的主干部分后,通過訓練所述頭部特征并行適配器和藥物分子性質預測網絡得到訓練好的特定分子性質預測模型;

    3、所述頭部特征并行適配器的計算過程包括:

    4、首先利用所述預訓練模型的特征提取部分提取藥物分子的特征向量xi,將所述藥物分子的特征向量xi分解為h個大小相等的頭特征hik,同時通過分割操作將特征向量xi映射到多個子空間:

    5、split(xi)=(hi1,hi2,…,hih)k=1,2,…,h

    6、將每個頭特征hik通過一個適配器adapterik進行處理,所述適配器adapterik包括:下投影層、非線性激活函數和上投影層;所述下投影層將頭特征映射到一個更低的維度,得到低維度特征xdown,然后通過所述非線性激活函數增加模型的非線性表達能力,最后所述上投影層將特征映射回原始維度,得到原始維度特征xup;

    7、所述適配器adapterik的輸出h′ik為:

    8、adapter(x)=relu(wdownx+bdown)wup+bup

    9、h′ik=adapterik(hik)k=1,2,3,…,h

    10、其中,表示下采樣矩陣,表示下采樣偏差,表示上采樣矩陣,表示上采樣偏差;m表示輸入x的維度,r表示瓶頸維度,r<<m;

    11、所有適配器處理后的頭特征h′ik通過拼接操作合并,并與所述藥物分子的特征向量xi通過殘差連接相結合,形成微調后的輸出特征x′i:

    12、x′i=concat(h′i1,h′i2,…,h′ih)+xi

    13、將所述微調后的輸出特征x′i輸入訓練好的藥物分子性質預測網絡,得到藥物分子性質。

    14、可選的,所述方法還包括:引入了頭特征并行交叉適配器hfpca,所有低維的適配器輸出特征首先被串聯起來進行聯合學習然后通過一個全連接層進行處理,以學習頭特征之間的交互;最終,通過分割操作將處理后的交叉特征匹配輸入特征的數量和維度。

    15、可選的,所述方法還包括:將藥物分子的結構信息轉換為smiles字符串或其他編碼形式,并通過化學信息學方法將其轉化為數值向量表示。

    16、可選的,所述方法采用transformer模型,且從transformer模型的第二層開始,在每個transformer層的前饋網絡和隨后的層歸一化之間插入所述頭部特征并行適配器。

    17、本專利技術提供一種分子性質預測微調系統,所述系統在用于藥物分子性質預測的預訓練模型中引入頭部特征并行適配器,凍結所述預訓練模型的主干部分后,通過訓練所述頭部特征并行適配器和藥物分子性質預測網絡得到訓練好的特定分子性質預測模型;

    18、所述頭部特征并行適配器包括:頭特征分割模塊、頭特征學習模塊、頭特征合并模塊;

    19、所述頭特征分割模塊,用于將所述預訓練模型提取的藥物分子的特征向量xi分解為h個大小相等的頭特征hik,同時通過分割操作將特征向量xi映射到多個子空間:

    20、split(xi)=(hi1,hi2,…,hih)k=1,2,…,h

    21、所述頭特征學習模塊對每個頭特征hik通過一個適配器adapterik進行處理,所述適配器adapterik包括:下投影層、非線性激活函數和上投影層;所述下投影層將頭特征映射到一個更低的維度,得到低維度特征xdown,然后通過所述非線性激活函數增加模型的非線性表達能力,最后所述上投影層將特征映射回原始維度,得到原始維度特征xup;

    22、所述適配器adapterik的輸出h′ik為:

    23、adapter(x)=relu(wdownx+bdown)wup+bup

    24、h′ik=adapterik(hik)k=1,2,3,…,h

    25、其中,表示下采樣矩陣,表示下采樣偏差,表示上采樣矩陣,表示上采樣偏差;m表示輸入x的維度,r表示瓶頸維度,r<<m;

    26、所述頭特征合并模塊將所有適配器處理后的頭特征h′ik通過拼接操作合并,并與所述藥物分子的特征向量xi通過殘差連接相結合,形成微調后的輸出特征x′i:

    27、x′i=concat(h′i1,h′i2,…,h′ih)+xi

    28、將所述微調后的輸出特征x′i輸入訓練好的藥物分子性質預測網絡,得到藥物分子性質。

    29、可選的,所述系統還包括頭特征并行交叉適配器hfpca,所有低維的適配器輸出特征首先被串聯起來進行聯合學習然后通過一個全連接層進行處理,以學習頭特征之間的交互;最終,通過分割操作將處理后的交叉特征匹配輸入特征的本文檔來自技高網...

    【技術保護點】

    1.一種分子性質預測微調方法,其特征在于,所述方法包括:在用于藥物分子性質預測的預訓練模型中引入頭部特征并行適配器,凍結所述預訓練模型的主干部分后,通過訓練所述頭部特征并行適配器和藥物分子性質預測網絡得到訓練好的特定分子性質預測模型;

    2.根據權利要求1所述的分子性質預測微調方法,其特征在于,所述方法還包括:引入了頭特征并行交叉適配器HFPCA,所有低維的適配器輸出特征首先被串聯起來進行聯合學習然后通過一個全連接層進行處理,以學習頭特征之間的交互;最終,通過分割操作將處理后的交叉特征匹配輸入特征的數量和維度。

    3.根據權利要求1所述的分子性質預測微調方法,其特征在于,所述方法還包括:將藥物分子的結構信息轉換為SMILES字符串或其他編碼形式,并通過化學信息學方法將其轉化為數值向量表示。

    4.根據權利要求1所述的分子性質預測微調方法,其特征在于,所述方法采用Transformer模型,且從Transformer模型的第二層開始,在每個Transformer層的前饋網絡和隨后的層歸一化之間插入所述頭部特征并行適配器。

    5.一種分子性質預測微調系統,其特征在于,所述系統在用于藥物分子性質預測的預訓練模型中引入頭部特征并行適配器,凍結所述預訓練模型的主干部分后,通過訓練所述頭部特征并行適配器和藥物分子性質預測網絡得到訓練好的特定分子性質預測模型;

    6.根據權利要求5所述的分子性質預測微調系統,其特征在于,所述系統還包括頭特征并行交叉適配器HFPCA,所有低維的適配器輸出特征首先被串聯起來進行聯合學習然后通過一個全連接層進行處理,以學習頭特征之間的交互;最終,通過分割操作將處理后的交叉特征匹配輸入特征的數量和維度。

    7.根據權利要求5所述的分子性質預測微調系統,其特征在于,所述系統將藥物分子的結構信息轉換為SMILES字符串或其他編碼形式,并通過化學信息學方法將其轉化為數值向量表示。

    8.根據權利要求5所述的分子性質預測微調系統,其特征在于,所述系統采用Transformer模型,且從Transformer模型的第二層開始,在每個Transformer層的前饋網絡和隨后的層歸一化之間插入所述頭部特征并行適配器。

    9.一種電子設備,其特征在于,包括存儲器和處理器;

    10.一種計算機可讀存儲介質,其特征在于,所述存儲介質上存儲有計算機程序,當所述計算機程序被處理器執行時,實現如權利要求1至4中任一項所述的分子性質預測微調方法。

    ...

    【技術特征摘要】

    1.一種分子性質預測微調方法,其特征在于,所述方法包括:在用于藥物分子性質預測的預訓練模型中引入頭部特征并行適配器,凍結所述預訓練模型的主干部分后,通過訓練所述頭部特征并行適配器和藥物分子性質預測網絡得到訓練好的特定分子性質預測模型;

    2.根據權利要求1所述的分子性質預測微調方法,其特征在于,所述方法還包括:引入了頭特征并行交叉適配器hfpca,所有低維的適配器輸出特征首先被串聯起來進行聯合學習然后通過一個全連接層進行處理,以學習頭特征之間的交互;最終,通過分割操作將處理后的交叉特征匹配輸入特征的數量和維度。

    3.根據權利要求1所述的分子性質預測微調方法,其特征在于,所述方法還包括:將藥物分子的結構信息轉換為smiles字符串或其他編碼形式,并通過化學信息學方法將其轉化為數值向量表示。

    4.根據權利要求1所述的分子性質預測微調方法,其特征在于,所述方法采用transformer模型,且從transformer模型的第二層開始,在每個transformer層的前饋網絡和隨后的層歸一化之間插入所述頭部特征并行適配器。

    5.一種分子性質預測微調系統,其特征在于,所述系統在用于藥物分子性質預測的預訓練模型中引入頭部特征并行...

    【專利技術屬性】
    技術研發人員:潘祥廉曉慶苗凱厲力華
    申請(專利權)人:微宏慧聯醫療科技無錫有限公司
    類型:發明
    國別省市:

    相關技術
      暫無相關專利
    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲高清无码在线观看| 性色AV无码中文AV有码VR| 国产色综合久久无码有码| 久久亚洲日韩看片无码| 人妻丰满熟妇A v无码区不卡| 无码日韩精品一区二区三区免费| 精品欧洲av无码一区二区14| 中文字幕无码一区二区三区本日| 亚洲av无码国产综合专区| 亚洲精品无码AV人在线播放| 亚洲va中文字幕无码| 亚洲aⅴ天堂av天堂无码麻豆| 国产成人无码综合亚洲日韩| 无码精品人妻一区| 人妻少妇精品无码专区动漫 | 无遮掩无码h成人av动漫| 亚洲精品无码专区久久久 | 无码毛片一区二区三区视频免费播放| 人妻丰满熟妇无码区免费| 亚洲中文字幕无码一区| 狠狠躁狠狠躁东京热无码专区 | 亚洲AV无码专区在线观看成人| 亚洲一区二区三区AV无码| 国产品无码一区二区三区在线蜜桃| 亚洲Av无码国产一区二区 | 一本一道AV无码中文字幕| 在线看片无码永久免费aⅴ| 无码丰满熟妇浪潮一区二区AV| 亚洲AV日韩AV无码污污网站| 无码中文字幕av免费放| 亚洲AV无码专区在线厂| 日韩av无码国产精品| 男男AV纯肉无码免费播放无码| 亚洲GV天堂GV无码男同| 99久无码中文字幕一本久道| 夜夜精品无码一区二区三区| 亚洲一级特黄大片无码毛片| 亚洲中文字幕无码爆乳AV| 无码久久精品国产亚洲Av影片| 无码A级毛片免费视频内谢| 无码播放一区二区三区|