System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于計(jì)算機(jī)輔助藥物研發(fā),具體涉及一種基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別方法。
技術(shù)介紹
1、在化學(xué)合成和藥物開發(fā)過程中,識(shí)別化學(xué)反應(yīng)中的待保護(hù)基團(tuán)至關(guān)重要。待保護(hù)基團(tuán)是指在反應(yīng)中可能受到不利影響或需要臨時(shí)保護(hù)以避免干擾的功能團(tuán)。準(zhǔn)確識(shí)別這些基團(tuán)能幫助化學(xué)家在逆合成設(shè)計(jì)中提前判斷反應(yīng)過程中哪些基團(tuán)需要保護(hù),從而有效調(diào)整反應(yīng)路線,避免不必要的試驗(yàn)和錯(cuò)誤,提高研究效率和成果的可靠性。
2、當(dāng)前的研究主要集中在利用保護(hù)基團(tuán)來實(shí)現(xiàn)化學(xué)合成中的選擇性反應(yīng)。保護(hù)基團(tuán)可以臨時(shí)性地掩蓋分子中的活性基團(tuán),防止其在不適當(dāng)?shù)姆磻?yīng)條件下參與反應(yīng)。例如,氨基可以被轉(zhuǎn)換為氨基甲酸酯,從而降低其反應(yīng)活性(welcome?to?bentham?sciencepublisher)。然而,傳統(tǒng)的保護(hù)基團(tuán)策略往往需要額外的步驟來實(shí)現(xiàn)保護(hù)和去保護(hù),這增加了合成的復(fù)雜性和成本(organic?chemistry?portal)。
3、近年來,研究者們開發(fā)了多種新的保護(hù)基團(tuán)技術(shù),包括光可拆除保護(hù)基團(tuán)和其他環(huán)境敏感的保護(hù)基團(tuán)(springer)。這些技術(shù)在提高反應(yīng)選擇性、簡(jiǎn)化合成步驟和減少環(huán)境影響方面顯示出巨大潛力。然而,盡管這些進(jìn)展顯著,但仍然缺乏一種能夠自動(dòng)、高效識(shí)別待保護(hù)基團(tuán)的工具。
4、目前,識(shí)別待保護(hù)基團(tuán)的工作主要依賴于化學(xué)家的經(jīng)驗(yàn)和理論知識(shí)。然而,隨著合成目標(biāo)分子的復(fù)雜性增加,傳統(tǒng)方法在準(zhǔn)確性和效率上顯得不足。現(xiàn)有的方法無法自動(dòng)化識(shí)別待保護(hù)基團(tuán),這限制了化學(xué)合成的效率和成功率。此外,保護(hù)基團(tuán)的選擇和使用需要綜合考慮
5、為此,本專利技術(shù)提出了一種基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別方法。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的在于解決現(xiàn)有識(shí)別待保護(hù)基團(tuán)的方法準(zhǔn)確性和效率上均存在不足的技術(shù)問題,而提供一種基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別方法,該方法旨在訓(xùn)練一個(gè)友好型的深度學(xué)習(xí)模型來完成化學(xué)反應(yīng)中待保護(hù)基團(tuán)的預(yù)判別,為化學(xué)類的研究(比如逆合成)提供指導(dǎo)方向,填補(bǔ)了當(dāng)前研究中的空白。
2、為實(shí)現(xiàn)上述目的,本專利技術(shù)所提供的技術(shù)解決方案是:
3、一種基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特殊之處在于:自輸入至輸出包括特征提取模塊、特征重構(gòu)模塊、組合特征構(gòu)建模塊以及判別器;
4、所述特征提取模塊用于構(gòu)建參與化學(xué)反應(yīng)的各個(gè)反應(yīng)物中每個(gè)原子的初始特征;
5、所述特征重構(gòu)模塊包括自注意力層、圖注意力網(wǎng)絡(luò)層(即gat層)以及拼接層,用于對(duì)特征提取模塊輸出的每個(gè)原子的初始特征進(jìn)行重構(gòu),聚合每個(gè)原子及其周圍其他原子的信息(比如:鄰居或二階鄰居的信息)之后構(gòu)建其全新特征(即,增加了原子與其鄰居原子之間的相關(guān)性);
6、所述組合特征構(gòu)建模塊用于拼接參與化學(xué)反應(yīng)的所有反應(yīng)物中任意兩個(gè)原子的全新特征,形成多組拼接特征;
7、所述判別器自輸入至輸出包括隱藏層和輸出層,用于將各個(gè)拼接特征進(jìn)行非線性變換,并輸出化學(xué)反應(yīng)待保護(hù)基團(tuán)判別結(jié)果(即哪些原子之間發(fā)生化學(xué)反應(yīng),哪些原子之間不發(fā)生化學(xué)反應(yīng));其中,隱藏層為具有l(wèi)層的多層感知機(jī)(mlp)。
8、進(jìn)一步地,本專利技術(shù)中,特征提取模塊可以采用現(xiàn)有的特征提取模塊,其輸入是化學(xué)分子smiles格式的數(shù)據(jù),通過rdkit提取特征后,再通過拼接的方式構(gòu)建原子的初始特征,即將原子的所有的特征拼接;其具體處理過程如下:
9、將反應(yīng)物化學(xué)分子處理成標(biāo)準(zhǔn)smiles格式作為輸入,針對(duì)反應(yīng)物化學(xué)分子中的每個(gè)原子,提取以下特征,并將所有特征拼接成特征向量,形成該原子的初始特征:
10、①采用one-hot編碼方式表示每個(gè)原子的種類,特征長度23維;
11、②計(jì)算每個(gè)原子的度,特征長度1維;
12、③判斷原子是否屬于芳香環(huán),用0、1表示,特征長度1維;
13、④計(jì)算與該原子連接的氫原子的個(gè)數(shù),特征長度1維;
14、⑤計(jì)算該原子所帶的電荷數(shù),特征長度1維;
15、⑥統(tǒng)計(jì)該原子的原子質(zhì)量,特征長度1維;
16、⑦統(tǒng)計(jì)該原子的電負(fù)性,特征長度1維;
17、拼接后每個(gè)原子的特征向量長度為以上特征的長度之和29維。
18、進(jìn)一步地,所述特征重構(gòu)模塊的具體處理過程如下:
19、①利用自注意力層抓取目標(biāo)原子與其他原子之間的相關(guān)性:
20、計(jì)算query、key和value矩陣
21、對(duì)于輸入序列(反應(yīng)物化學(xué)分子所有原子的集合)所有原子的集合其中,n是原子數(shù),d是每個(gè)原子特征的維度,首先通過三個(gè)不同的權(quán)重矩陣將其映射到query、key和value矩陣:
22、q=xwq,k=xwk,v=xwv
23、其中,x為原子的初始特征,是可訓(xùn)練的權(quán)重矩陣;dk為原始特征變換之后的維度;
24、計(jì)算注意力權(quán)重
25、使用query和key之間的點(diǎn)積來計(jì)算注意力權(quán)重,并對(duì)其進(jìn)行縮放和softmax歸一化:
26、
27、其中,是縮放因子,是注意力權(quán)重矩陣;
28、計(jì)算自注意力輸出
29、使用注意力權(quán)重矩陣和value矩陣計(jì)算輸出:
30、
31、其中,是自注意力層的輸出;則表示原子i經(jīng)過自注意力層更新過后的特征;
32、綜上可知,自注意力層的輸入為特征提取模塊輸出的化學(xué)分子原子初始特征的集合,輸出為經(jīng)過自注意力層更新過后的特征;
33、②利用圖注意力網(wǎng)絡(luò)層抓取目標(biāo)原子對(duì)其鄰居原子的注意力:
34、對(duì)于輸入的每個(gè)反應(yīng)物的化學(xué)分子,基于原子之間的化學(xué)鍵,在輸入圖注意力網(wǎng)絡(luò)層之前還需將化學(xué)分子轉(zhuǎn)化成一個(gè)拓?fù)鋱D;
35、節(jié)點(diǎn)特征線性變換
36、對(duì)于拓?fù)鋱D中每個(gè)節(jié)點(diǎn)(即化學(xué)分子的每個(gè)原子)i及其特征向量首先通過一個(gè)可訓(xùn)練的權(quán)重矩陣進(jìn)行線性變換:
37、x′i=wxi
38、其中,是可訓(xùn)練的權(quán)重矩陣,是原子i變換后的特征向量;
39、計(jì)算注意力系數(shù)
40、對(duì)于每一對(duì)相鄰節(jié)點(diǎn)i和j,其中,表示原子i的鄰居原子集合,計(jì)算注意力系數(shù):
41、eij=leakyrelu(at[x′i∥xj′])
42、其中,是可訓(xùn)練的權(quán)重向量,||表示向量連接操作,leakyrelu是激活函數(shù);
43、計(jì)算原子特征的加權(quán)求和
44、使用歸一化后的注意力系數(shù)對(duì)鄰居原子的特征進(jìn)行加權(quán)求和,得到原子i的新的特征表示:
45、
46、其中,σ是激活函數(shù)(如relu);表示原子i經(jīng)過圖注意力網(wǎng)絡(luò)層更新過后的特征;xj′為原子j變換后的特征向量;
47、綜上可知,圖注意力網(wǎng)絡(luò)層的輸入為特征提取模塊輸出的化學(xué)分子本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于:自輸入至輸出包括特征提取模塊、特征重構(gòu)模塊、組合特征構(gòu)建模塊以及判別器;
2.根據(jù)權(quán)利要求1所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于,所述特征提取模塊的具體處理過程如下:
3.根據(jù)權(quán)利要求2所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于,所述特征重構(gòu)模塊的具體處理過程如下:
4.根據(jù)權(quán)利要求3所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于,所述組合特征構(gòu)建模塊的具體處理過程如下:
5.根據(jù)權(quán)利要求4所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于,所述判別器的具體處理過程如下:
6.一種基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別方法,其特征在于:將待判別化學(xué)反應(yīng)中的所有反應(yīng)物化學(xué)分子輸入訓(xùn)練好的權(quán)利要求1-5任一所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型中,輸出化學(xué)反應(yīng)待保護(hù)基團(tuán)判別結(jié)果。
7.根據(jù)權(quán)利要求6所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別方法,其特征在于,所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)
8.根據(jù)權(quán)利要求7所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別方法,其特征在于:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于:所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求6所述方法的步驟。
10.一種電子設(shè)備,其特征在于:包括處理器和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì);
...【技術(shù)特征摘要】
1.一種基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于:自輸入至輸出包括特征提取模塊、特征重構(gòu)模塊、組合特征構(gòu)建模塊以及判別器;
2.根據(jù)權(quán)利要求1所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于,所述特征提取模塊的具體處理過程如下:
3.根據(jù)權(quán)利要求2所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于,所述特征重構(gòu)模塊的具體處理過程如下:
4.根據(jù)權(quán)利要求3所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于,所述組合特征構(gòu)建模塊的具體處理過程如下:
5.根據(jù)權(quán)利要求4所述基于注意力網(wǎng)絡(luò)的化學(xué)反應(yīng)待保護(hù)基團(tuán)判別模型,其特征在于,所述判別器的具體處理過程如下:
6.一種基...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李兆豐,趙鵬程,王浩洋,
申請(qǐng)(專利權(quán))人:陜西精致科技發(fā)展有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。