System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于藥物研發生物,特別是涉及基于機器學習的細胞器組合表型高通量藥物篩選方法。
技術介紹
1、傳統的藥物篩選方法通常依賴于人工提取細胞參數和主觀判斷,效率低下且容易出錯,隨著機器學習技術的發展,自動化、高通量的細胞分析方法逐漸成為藥物篩選領域的研究熱點,然而,現有的機器學習方法在處理復雜細胞圖像時仍存在一定的局限性,無法充分挖掘細胞信息的潛力,因此,有必要提出一種新型的藥物篩選系統,以提高篩選效率和準確性,因此我們提出基于機器學習的細胞器組合表型高通量藥物篩選方法。
技術實現思路
1、本專利技術的目的在于提供基于機器學習的細胞器組合表型高通量藥物篩選方法,通過結合comorgannet進行細胞圖像分析和預處理,以及efficientnet?v2進行深度學習分類,解決了現有機器學習方法在處理復雜細胞圖像時仍存在一定的局限性,無法充分挖掘細胞信息的潛力問題。
2、為解決上述技術問題,本專利技術是通過以下技術方案實現的:
3、本專利技術為基于機器學習的細胞器組合表型高通量藥物篩選方法,包括以下步驟;
4、步驟一:comorgannet對細胞圖像分析流程;
5、步驟二:comorgannet模型性能評估;
6、步驟三:擴展數據集中的comorgannet性能;
7、步驟四:comorgannet與常規細胞參數提取方法的對比;
8、步驟五:驗證comorgannet分類模型實用性;
9、步
10、進一步地,所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟一中,使用2.1節所述comorgannet結構,在識別細胞核的中心后,將圖像以各細胞核中心周圍裁剪300×300的分割圖像(圖2),在裁剪后,通過opencv中的merge函數將各通道圖像進行通道合并,隨后,將300×300×n(n?=?3或4)的圖像輸入預訓練的efficientnet?v2卷積神經網絡中進行分類模型的訓練(圖3);
11、為了研究分類的內在邏輯,進行了可解釋性研究,圖像經過efficientnet?v2卷積神經網絡的中間隱藏層圖像被提取出來,提供了模型預測的視覺解釋,我們發現淺層的大多數單元“crop_stem?conv”與“crop_blocks?conv”被調整為基本的集合特征,如形狀和紋理(圖4)。
12、進一步地,所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟二中,我們用efficientnet?v2卷積神經網絡進行二分類訓練實驗,對照組分別與100m?ang-ii組,80m?is?o組,隨后,我們分別在每一單獨通道圖像中訓練神經網絡,損失曲線與精度曲線如圖5和圖6所示驗證集在20個epoch以后的精度都不高,損失的收斂也不佳,單通道圖像在對照組-ang-ii組分類與對照組-iso組分類中的表現都不佳,因此在現有模型下,單通道圖像不能實現穩定的預測;
13、根據任務類型,我們使用3個通道的圖像進行分類,卷積神經網絡模型在15個epoch之后在驗證集中達到了80%的精確度(圖7和圖8);
14、根據受試者工作特征曲線(receiver?operating?characteristic,roc)與混淆矩陣的結果來看,其中細胞器組合-細胞核-溶酶體-線粒體(通道1,3,4)在對照組與ang-ii組的二分類任務中效果最好(圖9);
15、此外,我們通過t-sne降維方法將圖像通過卷積模塊得到的特征向量進行降維可視化,從圖10中可以看到,特征向量較好地將兩組進行區分,體現兩組的差異,為了定量確定散點的重疊性,我們計算了散點的平均輪廓系數(silhouette?coefficient),其中每個點的簇標識是其類別(預測類別與真實類別),真實標簽散點圖與預測標簽散點圖的分數分別為2.9%與3.6%,同時,如圖11,關于對照組-iso組的二分類也實現了相似的效果(auc=0.99);
16、真實標簽散點圖與預測標簽散點圖的分數分別為4.2%與4.5%(圖12),結果表明,基于組合細胞器的comorgannet在兩個二分類任務中也具有優勢;
17、構建comorgannet的目的是為了更有效地區分不同造模劑構建的心肌肥大模型,因此我們采用comorgannet進行三分類的訓練;心肌肥大相似狀態的訓練和驗證精確度如圖13所示;
18、如圖14顯示,單通道圖像訓練的模型性能較差(每個通道的準確度,召回率,f1值都低于0.8),因此,單通道圖像也不適合進行三種心肌細胞狀態的分類;
19、如圖15與圖16,在對比了不同通道組合圖像分類模型之后,我們發現線粒體-溶酶體組合的模型達到了更高的精確度(準確度、召回率、f1值分別為0.91,0.92,0.90);
20、混淆矩陣的結果(圖17),也證實了我們的模型在區分對照組、100m?ang-ii組、80m?iso組種實現了最好的效果,因此,在后續的實驗中,我們還將基于線粒體-溶酶體圖像分析作為組合細胞器進行研究。
21、進一步地,所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟三中,此外,本研究還使用另外兩個擴展數據集來驗證基于組合細胞器的comorgannet,包括纖維化細胞模型圖像數據集(nih/3t3細胞與10?ng/ml?tgf-β1造模的nih/3t3細胞,?17760張tiff格式圖像,如圖18),以及非酒精性脂肪性肝炎細胞模型圖像數據集(hepg2細胞與200m?pa造模的hepg2細胞,?6000?張tiff圖像,如圖19);
22、roc曲線與混淆矩陣(圖20)顯示comorgannet在上述兩個數據集中分別實現了最佳效果(auc=0.99),同樣地,隱藏層特征向量的t-sne降維散點圖,體現了較好的分群特性,纖維化細胞模型數據集中真實標簽散點圖與預測標簽散點圖的輪廓系數分別為4.2%與4.5%(圖21),非酒精性脂肪性肝炎細胞模型數據集中真實標簽散點圖與預測標簽散點圖的輪廓系數分別為5.3%與5.4%(圖22),這些結果表明,基于組合細胞器的comorgannet在纖維化細胞模型的數據集和非酒精性脂肪性肝炎細胞模型的數據集上均表現出優勢;
23、同時,與其他卷積神經網絡模型架構如vgg19,resnet50,densenet161相比,comorgannet也顯示出較優的性能,包括在心肌肥大、纖維化、非酒精性脂肪性肝炎細胞模型這三個數據集中。這幾種網絡架構在3個數據集中的一些分類性能指標,如精確度、準確度、召回率、f1值,顯示在表23當中。
24、進一步地,所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟四中,進一步將模型的性能與先前發表的常規方法進行了比較,使用了兩種常規的軟件:ha本文檔來自技高網...
【技術保護點】
1.基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于:包括以下步驟;
2.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟一中,使用2.1節所述ComOrganNet結構,在識別細胞核的中心后,將圖像以各細胞核中心周圍裁剪300×300的分割圖像(圖2),在裁剪后,通過OpenCV中的merge函數將各通道圖像進行通道合并,隨后,將300×300×n(n=3或4)的圖像輸入預訓練的EfficientNet?V2卷積神經網絡中進行分類模型的訓練(圖3);
3.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟二中,我們用EfficientNet?V2卷積神經網絡進行二分類訓練實驗,對照組分別與100μM?Ang-II組,80μM?IS?O組,隨后,我們分別在每一單獨通道圖像中訓練神經網絡,損失曲線與精度曲線如圖5和圖6所示驗證集在20個epoch以后的精度都不高,損失的收斂也不佳,單通道圖像在對照組-Ang-II組分類與對照組-ISO組分類中的表現都不佳,因此在現有模型下,單通道
4.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟三中,此外,本研究還使用另外兩個擴展數據集來驗證基于組合細胞器的ComOrganNet,包括纖維化細胞模型圖像數據集(NIH/3t3細胞與10ng/mL?TGF-β1造模的NIH/3t3細胞,17760張TIFF格式圖像,如圖18),以及非酒精性脂肪性肝炎細胞模型圖像數據集(HepG2細胞與200μM?PA造模的HepG2細胞,6000張TIFF圖像,如圖19);
5.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟四中,進一步將模型的性能與先前發表的常規方法進行了比較,使用了兩種常規的軟件:Harmony?4.9和CellProfiler4.2.6;2.2.4節描述了此部分的全部細節,其中Harmony?4.9輸出了147個形態學參數,CellProfiler?4.2.6輸出了99個形態學參數;
6.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟五中,為驗證ComOrganNet分類模型的實用性,本章進行了以下一個案例研究:
7.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟六中,如表S2(附錄),天然產物庫從中藥單體化合物庫中建立,其中大部分純度超過99%;將化合物溶解于DMSO中配置成濃度為10mM的母液,并在-80℃中保存,共對105種化合物在最終濃度為10μM的情況下進行了3次測試,在每個處理板上分別建立模型孔(用100μM的Ang-I?I)和空白孔(不含化合物處理),以控制質量,加入化合物后,細胞在37℃下孵育24小時,然后,固定細胞,并用如前所述的HOECHST?33342等染料染色,每個化合物測試3個復孔;當用ComOrganNet進行分析時,計算每種化合物正常細胞的比例,對比例最高的10種化合物進行了進一步研究。
8.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟六中,為了驗證ComOrganNet的實用性,本研究使用ComOrganNet對一個自制的天然產物庫(包括105個中藥單體化合物)的細胞表型圖像進行分析,并根據它們對100μMAng-I?I細胞圖像的影響來識別心肌肥大的潛在調節因子,通過3.2.2所述方法獲得細胞核、細胞骨架、溶酶體和線粒體通道的33×4張圖像,采集這些圖像,然后分別用常規方法和ComOrganNet進行處理,結果顯示,用常規方法篩選出16種化合物,用ComOrganNet方法篩選出45種化合物,包括甘草素、木犀草素-5-O-葡萄糖苷、3’-羥基葛根素、3,4-二甲氧基肉桂酸、1,3-二咖啡??鼘幩帷ⅫS芪甲苷等,其中,這45種化合物包含了16種常規方法篩選的化合物(圖33、圖34);其余的45種化合物被進一步驗證,它們的名稱與CAS登記號,如表S1所示,
...【技術特征摘要】
1.基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于:包括以下步驟;
2.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟一中,使用2.1節所述comorgannet結構,在識別細胞核的中心后,將圖像以各細胞核中心周圍裁剪300×300的分割圖像(圖2),在裁剪后,通過opencv中的merge函數將各通道圖像進行通道合并,隨后,將300×300×n(n=3或4)的圖像輸入預訓練的efficientnet?v2卷積神經網絡中進行分類模型的訓練(圖3);
3.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟二中,我們用efficientnet?v2卷積神經網絡進行二分類訓練實驗,對照組分別與100μm?ang-ii組,80μm?is?o組,隨后,我們分別在每一單獨通道圖像中訓練神經網絡,損失曲線與精度曲線如圖5和圖6所示驗證集在20個epoch以后的精度都不高,損失的收斂也不佳,單通道圖像在對照組-ang-ii組分類與對照組-iso組分類中的表現都不佳,因此在現有模型下,單通道圖像不能實現穩定的預測;
4.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟三中,此外,本研究還使用另外兩個擴展數據集來驗證基于組合細胞器的comorgannet,包括纖維化細胞模型圖像數據集(nih/3t3細胞與10ng/ml?tgf-β1造模的nih/3t3細胞,17760張tiff格式圖像,如圖18),以及非酒精性脂肪性肝炎細胞模型圖像數據集(hepg2細胞與200μm?pa造模的hepg2細胞,6000張tiff圖像,如圖19);
5.根據權利要求1所述的基于機器學習的細胞器組合表型高通量藥物篩選方法,其特征在于,步驟四中,進一步將模型的性能與先前發表的常規方法進行了比較,使用了兩種常規的軟件:harmony?4.9和cellprofiler4.2.6;2.2.4節描述了此部分的全部細節,其中harmon...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。