【技術實現步驟摘要】
一種標志物相關性檢測方法以及裝置
本專利技術涉及生物
,尤其涉及一種標志物相關性檢測方法以及裝置。
技術介紹
基因表達譜等生物數據往往具有幾萬甚至數十萬個標志物,其中,標志物反應了生物的一方面化學、生物類物質的性質。對這些標志物進行相關性檢測分析是很多研究的基礎。在現有技術中,通常是在二維空間利用相似性矩陣來表達標志物之間的關系。其中,相似性矩陣的行坐標a和列坐標b都是標志物,而相似性矩陣中的第a行第b列的元素值,代表第a個標志物和第b個標志物之間的相似性。相似性的度量往往有很多種,比如相關系數,歐拉距離,余弦函數等。在這種方式下,使用者每次只能觀察兩個標志物之間的相關性,例如,要觀察第a個標志物和第b個標志物之間的相似性,可以通過觀察相似性矩陣中的第a行第b列的元素值。但是,如果要求同時觀察三個或者更多的標志物之間的相關性,則無法通過二維的相似矩陣進行觀察,而必須在更高維的空間才能進行觀察。例如,要觀察三個標志物的相關性,則必須在三維空間進行觀察;要觀察四個標志物的相關性,則必須在三維空間進行觀察,等等。所以,當生物數據包含幾萬甚至數十萬個標志物,空間維數將復雜得超乎思維可以想象的程度。
技術實現思路
本專利技術實施例所要解決的技術問題在于,提供一種標志物相關性檢測方法以及裝置,實現了將所有標志物的相關性降維至可視化的低維度進行顯示。本專利技術第一方面提供了一種標志物相關性檢測方法,包括:根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率,其中,i為正整數,i小于或等于M,M為所述標志物的數量,N為所述采樣樣本的數量;重復上一個步驟,直到求 ...
【技術保護點】
一種標志物相關性檢測方法,其特征在于,包括:根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率,其中,i為正整數,i小于或等于M,M為所述標志物的數量,N為所述采樣樣本的數量;重復上一個步驟,直到求出每個標志物的費舍爾比率;根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離,其中,a,b均為正整數,a,b均小于或等于M;重復上一個步驟,直到求出任意兩個標志物之間的距離;將所有的兩個標志物之間的距離和降維后的維度作為多維標度算法的輸入,從而獲得每個標志物的坐標值;根據每個標志物的費舍爾比率獲得每個標志物在散點圖上的大小,并根據每個標志物的坐標值獲得每個標志物在散點圖上的坐標。
【技術特征摘要】
1.一種標志物相關性檢測方法,其特征在于,包括:根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率,其中,i為正整數,i小于或等于M,M為所述標志物的數量,N為所述采樣樣本的數量;重復上一個步驟,直到求出每個標志物的費舍爾比率;根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離,其中,a,b均為正整數,a,b均小于或等于M;重復上一個步驟,直到求出任意兩個標志物之間的距離;將所有的兩個標志物之間的距離和降維后的維度作為多維標度算法的輸入,從而獲得每個標志物的坐標值;根據每個標志物的費舍爾比率獲得每個標志物在散點圖上的大小,并根據每個標志物的坐標值獲得每個標志物在散點圖上的坐標;所述根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離具體為:根據計算出第a個標志物和第b個標志物之間的距離,其中,j為采樣樣本的序號,為所述第a個標志物第j個歸一化后的采樣樣本的值,為所述第b個標志物第j個歸一化后的采樣樣本的值,Dab為第a個標志物和第b個標志物之間的距離。2.根據權利要求1所述的方法,其特征在于,根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率之前包括:根據所述第i個標志物的多個采樣樣本進行歸一化計算,以得到多個歸一化后的采樣樣本;根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率具體為:根據第i個標志物的多個歸一化后的采樣樣本計算所述第i個標志物的費舍爾比率。3.根據權利要求2所述的方法,其特征在于,根據所述第i個標志物的多個采樣樣本進行歸一化計算,以得到多個歸一化后的采樣樣本具體為:根據進行歸一化計算,以得到多個歸一化后的采樣樣本,其中,Xi為所述第i個標志物的多個采樣樣本所組成的向量,ui為所述第i個標志物的多個采樣樣本的平均值,ρi為所述第i個標志物的多個采樣樣本的標準差,Xi'為多個歸一化后的采樣樣本所組成的向量。4.根據權利要求3所述的方法,其特征在于,根據第i個標志物的多個歸一化后的采樣樣本計算所述第i個標志物的費舍爾比率具體為:根據求出第i個標志物中類別為0的采樣樣本的平均值,其中,j為第i個標志物中采樣樣本的序號,Yj為第i個標志物中第j個采樣樣本的類別,當Yj=0時,第j個采樣樣本的類別為0,當Yj=1時,第j個采樣樣本的類別為1,為第i個標志物的第j個歸一化后的采樣樣本的值,m0為第i個標志物中類別為0的采樣樣本的平均值;根據求出第i個標志物中類別為0的采樣樣本的標準差,其中,v0為第i個標志物中類別為0的采樣樣本的標準差;根據求出第i個標志物中類別為1的采樣樣本的平均值,其中,m1為第i個標志物中類別為1的采樣樣本的平均值;根據求出第i個標志物中類別為1的采樣樣本的標準差,其中,v1為第i個標志物中類別為1的采樣樣本的標準差;根據計算第i個標志物的費舍爾比率。5.根據權利要求1至4任一權利要求所述的方法,其特征在于,所述降維后的維度為2維...
【專利技術屬性】
技術研發人員:周豐豐,孟慶漢,
申請(專利權)人:深圳先進技術研究院,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。