System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于單細胞rna測序數據分析領域,具體涉及一種用于單細胞rna測序數據的關聯圖嵌入細胞類群劃分方法。
技術介紹
1、單細胞rna測序技術結合了高通量測序技術可以在單細胞水平上測量細胞中的基因表達水平,從而可以揭示細胞轉錄異質性,這為生物學家從基因表達譜中破譯細胞功能和探索異質性分子基礎的多樣性奠定了良好的基礎。對單細胞rna測序數據進行下游分析的關鍵一步是將具有相同基因表達模式的細胞劃分為同一類群,以便剖析細胞的生物學機理以及細胞類群的調控模式。然而,單細胞rna測序數據本身具有的高維度、高稀疏性和復雜的噪音干擾會嚴重影響單細胞基因表達模式的判斷,這使得一些不同類型的細胞被誤分為同一類群,這對細胞類群進行有效劃分帶來了巨大挑戰。而傳統的方法是使用單視角方法對單細胞rna測序數據進行處理,無法達到理想的細胞類群劃分效果。因此,需要可以克服這些難點的新穎方法來解決面向單細胞rna測序數據的細胞類群劃分應用。
技術實現思路
1、為了解決上述問題,本專利技術提供了一種用于單細胞rna測序數據的關聯圖嵌入細胞類群劃分方法,所述方法包括步驟:
2、獲取單細胞rna測序數據集,對數據集去除低表達值的基因,得到單細胞rna基因表達矩陣x,根據x使用三種特征提取方法構建細胞-細胞多視角關聯圖空間{s(1),s(2),s(3)};
3、對單細胞rna基因表達矩陣x使用自適應鄰域圖學習方法優化上述細胞-細胞多視角關聯圖空間;
4、通過將細胞-細胞多視角關聯圖
5、通過對細胞-細胞多視角關聯圖空間進行譜嵌入分解2得到視角一致嵌入矩陣和視角特定嵌入矩陣;
6、用視角特定嵌入矩陣構建視角特定嵌入張量并對其施加加權張量低秩約束;
7、將所述一致嵌入矩陣和視角一致嵌入矩陣結合為細胞雙一致嵌入矩陣,應用k-means方法得到細胞類群的劃分結果,結合所述數據集中細胞的真實標簽得出類群劃分的準確率。
8、進一步地,對單細胞rna測序數據集去除低表達值基因得到單細胞rna基因表達矩陣x,根據x構建細胞-細胞多視角關聯圖空間{s(1),s(2),s(3)}的三種特征提取方法如下:通過pca方法對x進行降維,對降維后的基因表達矩陣用pcc方法計算細胞之間的相關性構建細胞-細胞關聯圖s(1);通過nndsvd方法由x得到低秩因子u,將轉置后的u與x做矩陣乘法得到另一個低秩因子v,然后將v做內積得到自表示矩陣z,將z對稱化作為細胞-細胞關聯圖s(2);對x分別使用高斯、多項式、線性三種核函數計算得到三個核矩陣,將三個核矩陣取均值得到綜合核矩陣kg,對kg進行特征分解得到低冗余表示n,用n做內積并對稱化作為細胞-細胞關聯圖s(3);將s(1)、s(2)和s(3)組成細胞-細胞多視角關聯圖空間。
9、進一步地,所述自適應鄰域圖學習方法表達公式為:
10、
11、其中,為視角v的細胞-細胞關聯圖,代表視角v中第i個細胞與第j個細胞之間的關聯度,n為細胞數量,xi代表x中第i個細胞的基因表達。
12、進一步地,所述譜嵌入分解1的表達公式為:
13、
14、其中,為細胞-細胞共識關聯圖,其為細胞-細胞多視角關聯圖空間{s(1),s(2),s(3)}去除不一致部分后的公共部分,為一致嵌入矩陣,n為細胞數量,k為秩,ht為h的轉置。
15、進一步地,所述譜嵌入分解2的表達公式為:
16、
17、其中,表示視角一致嵌入矩陣,表示視角v的特定嵌入矩陣,n為細胞數量,k為秩,為q(v)的轉置。
18、進一步地,所述加權張量低秩約束的表達公式為:
19、
20、其中,是由視角特定嵌入矩陣q(1)、q(2)和q(3)構成的三階張量,表示低秩約束,ωj為權重向量ω的第j個元素,表示對張量沿第三維的第i個切片進行快速傅里葉變換,為的第j大奇異值。
21、進一步地,將所述一致嵌入矩陣h和視角一致嵌入矩陣f進行拼接得到細胞雙一致嵌入矩陣p,隨后對p使用k-means方法得到細胞類群的劃分結果,結合所述數據集中細胞的真實標簽得出劃分的準確率。
22、本專利技術提供了一種用于單細胞rna測序數據的關聯圖嵌入細胞類群劃分方法,具有以下優勢:
23、(1)所述方法對單模態的單細胞rna測序數據集用三種不同的特征提取方法構建了細胞-細胞多視角關聯圖空間,從不同的角度充分挖掘細胞之間的關聯。
24、(2)所述方法對細胞-細胞共識關聯圖和細胞-細胞多視角關聯圖空間分別進行譜嵌入分解1和譜嵌入分解2,在保留細胞之間關鍵關聯的同時過濾掉噪音,并且綜合利用視角之間有價值的一致性信息和互補性信息。
25、(3)所述方法對視角特定嵌入張量施加加權張量低秩約束,利用張量結構靈活地探索視角關聯圖的高階相關性,獲得了細胞之間潛在的跨視角關聯,提高了劃分細胞類群的準確率。
本文檔來自技高網...【技術保護點】
1.一種用于單細胞RNA測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,所述方法包括步驟:
2.根據權利要求1所述的用于單細胞RNA測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,構建細胞-細胞多視角關聯圖空間的三種特征提取方法如下:
3.根據權利要求1所述的用于單細胞RNA測序數據的關聯圖嵌細胞類群劃分方法,其特征在于,所述自適應鄰域圖學習方法表達公式為:
4.根據權利要求1所述的用于單細胞RNA測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,所述譜嵌入分解1的表達公式為:
5.根據權利要求1所述的用于單細胞RNA測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,所述譜嵌入分解2的表達公式為:
6.根據權利要求1所述的用于單細胞RNA測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,所述加權張量低秩約束的表達公式為:
7.根據權利要求1所述的用于單細胞RNA測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,將一致嵌入矩陣H和視角一致嵌入矩陣F結合為細胞雙一致嵌入矩陣P,對P應用k-means方法得到細
...【技術特征摘要】
1.一種用于單細胞rna測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,所述方法包括步驟:
2.根據權利要求1所述的用于單細胞rna測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,構建細胞-細胞多視角關聯圖空間的三種特征提取方法如下:
3.根據權利要求1所述的用于單細胞rna測序數據的關聯圖嵌細胞類群劃分方法,其特征在于,所述自適應鄰域圖學習方法表達公式為:
4.根據權利要求1所述的用于單細胞rna測序數據的關聯圖嵌入細胞類群劃分方法,其特征在于,所述譜嵌入分解1的表達公式為:
...【專利技術屬性】
技術研發人員:李驁,紀彤彤,王春蕊,谷鳳偉,王莉莉,尹芳,
申請(專利權)人:哈爾濱理工大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。