System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助ad分析分類的方法。
技術(shù)介紹
1、目前用于阿爾茨海默癥(ad)分析分類的方法在不斷發(fā)展,旨在通過(guò)不同的數(shù)據(jù)源和分析技術(shù)提高疾病的早期診斷和分類準(zhǔn)確性。然而,現(xiàn)有的方法,如中國(guó)專利技術(shù)專利cn118196538a所述的基于多示例學(xué)習(xí)和多尺度特征融合的ad分類方法,盡管在一定程度上提高了分類的準(zhǔn)確性和泛化能力,但仍存在一些顯著的不足。
2、首先,中國(guó)專利cn118196538a主要基于結(jié)構(gòu)磁共振成像(smri)數(shù)據(jù),這種影像學(xué)方法在ad分類中的應(yīng)用雖然成熟,但存在一些固有的局限性。smri提供的主要是腦部結(jié)構(gòu)信息,盡管可以通過(guò)斑塊分割和多尺度特征提取來(lái)捕捉腦部某些區(qū)域的變化,但smri數(shù)據(jù)無(wú)法直接反映分子層面的病理變化。這意味著,smri只能捕捉到相對(duì)晚期的腦結(jié)構(gòu)變化,而無(wú)法揭示疾病早期的生物學(xué)標(biāo)志物。因此,該方法雖然可以識(shí)別出對(duì)分類結(jié)果有重大貢獻(xiàn)度的大腦區(qū)域,但這些區(qū)域的變化往往已經(jīng)是病變的結(jié)果,而非病變的起始。因此,這種方法在疾病早期診斷的敏感性上存在不足,無(wú)法有效識(shí)別出ad發(fā)展的早期分子信號(hào)。
3、其次,基于smri的分析方法高度依賴于圖像處理和特征提取技術(shù),這在處理過(guò)程中可能會(huì)引入額外的噪聲和誤差。例如,在中國(guó)專利cn118196538a的方法中,smri影像需要經(jīng)過(guò)多次斑塊分割和特征融合,這些步驟依賴于算法的準(zhǔn)確性以及數(shù)據(jù)的質(zhì)量。在實(shí)際操作中,smri圖像分辨率的限制、圖像采集過(guò)程中的變異性、以及患者個(gè)體差異,都可能導(dǎo)致特征提取的不準(zhǔn)確性。這種依賴多步驟處理的方法
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的是提供單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助ad分析分類的方法,從而解決
技術(shù)介紹
中所指出的部分弊端和不足。
2、本專利技術(shù)解決其上述的技術(shù)問(wèn)題所采用以下的技術(shù)方案:?jiǎn)渭?xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助ad分析分類的方法,包括:
3、s1、樣本采集與準(zhǔn)備:
4、s1.1、從ad患者和年齡匹配的健康對(duì)照中獲取腦組織樣本;使用腦組織生物庫(kù),或通過(guò)腦組織捐贈(zèng)項(xiàng)目獲取樣本;
5、s1.2、使用包括流式細(xì)胞術(shù),facs的細(xì)胞分離技術(shù)對(duì)腦組織進(jìn)行處理,獲得單個(gè)細(xì)胞懸液;通過(guò)機(jī)械和酶解的方法分離出包括神經(jīng)元、星形膠質(zhì)細(xì)胞、微膠質(zhì)細(xì)胞的不同類型的腦細(xì)胞;
6、s2、單細(xì)胞轉(zhuǎn)錄組測(cè)序:
7、s2.1、采用10xgenomicschromium的高通量單細(xì)胞轉(zhuǎn)錄組測(cè)序平臺(tái)對(duì)分離出的單細(xì)胞進(jìn)行測(cè)序,獲取每個(gè)細(xì)胞的基因表達(dá)譜;
8、s2.2、進(jìn)行數(shù)據(jù)質(zhì)量控制,去除低質(zhì)量細(xì)胞和低表達(dá)基因;利用cellranger的數(shù)據(jù)分析工具對(duì)原始測(cè)序數(shù)據(jù)進(jìn)行處理,生成基因表達(dá)矩陣;
9、s3、數(shù)據(jù)預(yù)處理:
10、s3.1、對(duì)基因表達(dá)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,包括使用log2轉(zhuǎn)換和z-score標(biāo)準(zhǔn)化,以消除不同樣本間的技術(shù)偏差;
11、s3.2、使用包括主成分分析pca、t-sne、umap的降維算法對(duì)高維數(shù)據(jù)進(jìn)行降維處理;
12、s4、特征提取:
13、s4.1、利用包括deseq2、edger的差異表達(dá)分析識(shí)別出ad患者和健康對(duì)照間顯著差異的基因;
14、s4.2、采用gsea進(jìn)行基因集富集分析和采用包括kegg、go進(jìn)行通路分析,確定與ad相關(guān)的關(guān)鍵基因通路和生物過(guò)程;
15、s5、ad的分類與診斷:
16、s5.1、將新樣本的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輸入訓(xùn)練好的分類模型,進(jìn)行ad分類預(yù)測(cè);
17、s5.2、輸出分類結(jié)果,并結(jié)合患者的臨床數(shù)據(jù)和其他包括aβ和tau蛋白水平的生物標(biāo)志物,提供綜合的輔助診斷建議。
18、進(jìn)一步地,所述數(shù)據(jù)質(zhì)量控制方法包括:
19、s1、低質(zhì)量細(xì)胞的去除:
20、計(jì)算每個(gè)細(xì)胞的總umi,uniquemolecularidentifier計(jì)數(shù)u和檢測(cè)到的基因數(shù)目g;利用公式:
21、
22、計(jì)算細(xì)胞質(zhì)量評(píng)分qc,低于預(yù)設(shè)閾值的細(xì)胞被認(rèn)為是低質(zhì)量細(xì)胞;
23、去除線粒體基因表達(dá)比例mgr過(guò)高的細(xì)胞;利用公式:
24、
25、其中,mmito為線粒體基因表達(dá)的總umi數(shù),mtotal為該細(xì)胞中所有基因表達(dá)的總umi數(shù);設(shè)定閾值θ,當(dāng)mgr>θ時(shí)去除該細(xì)胞;
26、利用包括umi計(jì)數(shù)、基因數(shù)目、線粒體基因比例的細(xì)胞過(guò)濾標(biāo)準(zhǔn)去除不符合標(biāo)準(zhǔn)的低質(zhì)量細(xì)胞;綜合評(píng)分s計(jì)算公式為:
27、
28、其中,α和β為權(quán)重參數(shù);低于設(shè)定閾值的細(xì)胞被去除;
29、s2、低表達(dá)基因的去除:
30、計(jì)算每個(gè)基因在所有細(xì)胞中的表達(dá)頻率f;利用公式:
31、
32、其中,fg為基因g的表達(dá)頻率,egi為基因g在第i個(gè)細(xì)胞中的表達(dá)量,n為總細(xì)胞數(shù);設(shè)定基因表達(dá)閾值δ,去除在少于百分比δ細(xì)胞中表達(dá)的基因;去除條件為:若fg<δ,則去除基因g。
33、進(jìn)一步地,所述使用cellranger軟件對(duì)原始測(cè)序數(shù)據(jù)fastq文件進(jìn)行處理,生成基因表達(dá)矩陣;
34、具體步驟如下:
35、s1、讀入原始測(cè)序數(shù)據(jù),進(jìn)行基因序列對(duì)齊;cellranger使用拼接對(duì)齊方式對(duì)齊reads到參考基因組,利用公式:
36、
37、其中,ai為第i個(gè)read的對(duì)齊評(píng)分,si為成功對(duì)齊的基因片段數(shù),ri為總reads數(shù);
38、s2、然后根據(jù)umi標(biāo)簽去重,生成去冗余的基因表達(dá)計(jì)數(shù);umi去重公式為:
39、
40、其中,uunique為去冗余后的umi計(jì)數(shù),m為所有umi標(biāo)簽數(shù),nj為第j個(gè)umi標(biāo)簽的重復(fù)計(jì)數(shù);
41、s3、生成初始的基因表達(dá)矩陣,記錄每個(gè)細(xì)胞中每個(gè)基因的表達(dá)水平;
42、表達(dá)矩陣生成公式為:
43、
44、其中,egi為第i個(gè)細(xì)胞中第g個(gè)基因的表達(dá)量,cgi為第i個(gè)細(xì)胞中第g個(gè)基因的umi計(jì)數(shù),utotal為第i個(gè)細(xì)胞中的總umi計(jì)數(shù)。
45、進(jìn)一步地,所述消除不同樣本間的技術(shù)偏差采用的方法包括:
46、s1、首先根據(jù)單細(xì)胞數(shù)據(jù)的umi計(jì)數(shù)具有泊松分布的特性,對(duì)每個(gè)細(xì)胞中的umi計(jì)數(shù)進(jìn)行改進(jìn)的log變換,使用方程式:
47、
48、其中,lgi為第i個(gè)細(xì)胞中第g個(gè)基因的改進(jìn)log變換后的表達(dá)值,cgi為原始umi計(jì)數(shù);通過(guò)平滑小的umi計(jì)數(shù)值,降低噪聲的影響;
49、s2、然后在進(jìn)行z-score標(biāo)準(zhǔn)化之前,引入權(quán)重因子,所述權(quán)重因子基于每個(gè)基因在所有細(xì)胞中的出現(xiàn)頻率,使用方程式:
50、本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助AD分析分類的方法,其特征在于包括以下步驟:
2.根據(jù)權(quán)利要求1所述的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助AD分析分類的方法,其特征在于所述數(shù)據(jù)質(zhì)量控制方法包括:
3.根據(jù)權(quán)利要求1所述的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助AD分析分類的方法,其特征在于所述使用CellRanger軟件對(duì)原始測(cè)序數(shù)據(jù)FASTQ文件進(jìn)行處理,生成基因表達(dá)矩陣;
4.根據(jù)權(quán)利要求1所述的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助AD分析分類的方法,其特征在于所述消除不同樣本間的技術(shù)偏差采用的方法包括:
5.根據(jù)權(quán)利要求1所述的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助AD分析分類的方法,其特征在于所述識(shí)別出AD患者和健康對(duì)照間顯著差異的基因方法構(gòu)建:
6.單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助AD分析分類的模型構(gòu)建,其特征在于包括以下步驟:
7.根據(jù)權(quán)利要求6所述的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助AD分析分類的方法,其特征在于所述模型訓(xùn)練、優(yōu)化模型參數(shù)方法包括:
【技術(shù)特征摘要】
1.單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助ad分析分類的方法,其特征在于包括以下步驟:
2.根據(jù)權(quán)利要求1所述的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助ad分析分類的方法,其特征在于所述數(shù)據(jù)質(zhì)量控制方法包括:
3.根據(jù)權(quán)利要求1所述的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助ad分析分類的方法,其特征在于所述使用cellranger軟件對(duì)原始測(cè)序數(shù)據(jù)fastq文件進(jìn)行處理,生成基因表達(dá)矩陣;
4.根據(jù)權(quán)利要求1所述的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)輔助ad分...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:史宇晨,劉睿菲,孔慧梅,于倩,吳湘杰,胡靜,
申請(qǐng)(專利權(quán))人:金華職業(yè)技術(shù)大學(xué),
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。