• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種標志物相關性檢測方法以及裝置制造方法及圖紙

    技術編號:11469431 閱讀:105 留言:0更新日期:2015-05-18 02:47
    本發明專利技術公開了一種標志物相關性檢測方法以及裝置。所述方法包括:根據第i個標志物的多個采樣樣本計算第i個標志物的費舍爾比率;重復上一個步驟,直到求出每個的標志物的費舍爾比率;根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離;重復上一個步驟,直到求出任意兩個標志物之間的距離;將所有的兩個標志物之間的距離和降維后的維度作為多維標度算法的輸入,從而獲得每個標志物的坐標值;根據每個標志物的費舍爾比率獲得每個標志物在散點圖上的大小,并根據每個標志物的坐標值獲得每個標志物在散點圖上的坐標。采用本發明專利技術,可將標志物的相關性降維至可視化的低維度進行顯示。

    【技術實現步驟摘要】
    一種標志物相關性檢測方法以及裝置
    本專利技術涉及生物
    ,尤其涉及一種標志物相關性檢測方法以及裝置。
    技術介紹
    基因表達譜等生物數據往往具有幾萬甚至數十萬個標志物,其中,標志物反應了生物的一方面化學、生物類物質的性質。對這些標志物進行相關性檢測分析是很多研究的基礎。在現有技術中,通常是在二維空間利用相似性矩陣來表達標志物之間的關系。其中,相似性矩陣的行坐標a和列坐標b都是標志物,而相似性矩陣中的第a行第b列的元素值,代表第a個標志物和第b個標志物之間的相似性。相似性的度量往往有很多種,比如相關系數,歐拉距離,余弦函數等。在這種方式下,使用者每次只能觀察兩個標志物之間的相關性,例如,要觀察第a個標志物和第b個標志物之間的相似性,可以通過觀察相似性矩陣中的第a行第b列的元素值。但是,如果要求同時觀察三個或者更多的標志物之間的相關性,則無法通過二維的相似矩陣進行觀察,而必須在更高維的空間才能進行觀察。例如,要觀察三個標志物的相關性,則必須在三維空間進行觀察;要觀察四個標志物的相關性,則必須在三維空間進行觀察,等等。所以,當生物數據包含幾萬甚至數十萬個標志物,空間維數將復雜得超乎思維可以想象的程度。
    技術實現思路
    本專利技術實施例所要解決的技術問題在于,提供一種標志物相關性檢測方法以及裝置,實現了將所有標志物的相關性降維至可視化的低維度進行顯示。本專利技術第一方面提供了一種標志物相關性檢測方法,包括:根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率,其中,i為正整數,i小于或等于M,M為所述標志物的數量,N為所述采樣樣本的數量;重復上一個步驟,直到求出每個的標志物的費舍爾比率;根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離,其中,a,b均為正整數,a,b均小于或等于M;重復上一個步驟,直到求出任意兩個標志物之間的距離;將所有的兩個標志物之間的距離和降維后的維度作為多維標度算法的輸入,從而獲得每個標志物的坐標值;根據每個標志物的費舍爾比率獲得每個標志物在散點圖上的大小,并根據每個標志物的坐標值獲得每個標志物在散點圖上的坐標。其中,根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率之前包括:根據所述第i個標志物的多個采樣樣本進行歸一化計算,以得到多個歸一化后的采樣樣本;根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率具體為:根據第i個標志物的多個歸一化后的采樣樣本計算所述第i個標志物的費舍爾比率。其中,根據所述第i個標志物的多個采樣樣本進行歸一化計算,以得到多個歸一化后的采樣樣本具體為:根據進行歸一化計算,以得到多個歸一化后的采樣樣本,其中,Xi為所述第i個標志物的多個采樣樣本所組成的向量,ui為所述第i個標志物的多個采樣樣本的平均值,ρi為所述第i個標志物的多個采樣樣本的標準差,X′i為多個歸一化后的采樣樣本所組成的向量。其中,根據第i個標志物的多個歸一化后的采樣樣本計算所述第i個標志物的費舍爾比率具體為:根據求出第i個標志物中類別為0的采樣樣本的平均值,其中,j為第i個標志物中采樣樣本的序號,Yj為第i個標志物中第j個采樣樣本的類別,當Yj=0時,第j個采樣樣本的類別為0,當Yj=1時,第j個采樣樣本的類別為1,X′ij為第i個標志物的第j個歸一化后的采樣樣本的值,m0為第i個標志物中類別為0的采樣樣本的平均值;根據求出第i個標志物中類別為0的采樣樣本的標準差,其中,v0為第i個標志物中類別為0的采樣樣本的標準差;根據求出第i個標志物中類別為1的采樣樣本的平均值,其中,m1為第i個標志物中類別為1的采樣樣本的平均值;根據求出第i個標志物中類別為1的采樣樣本的標準差,其中,v1為第i個標志物中類別為1的采樣樣本的標準差;根據計算第i個標志物的費舍爾比率。其中,根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離具體為:根據計算出第a個標志物和第b個標志物之間的距離,其中,j為采樣樣本的序號,X'aj為所述第a個標志物第j個歸一化后的采樣樣本的值,X′bj為所述第b個標志物第j個歸一化后的采樣樣本的值,Dab為第a個標志物和第b個標志物之間的距離。其中,所述降維后的維度為2維或者3維。其中,每個標志物的費舍爾比率與每個標志物在散點圖上的大小成正比例。本專利技術第二方面提供了一種標志物相關性檢測裝置,包括:費舍爾比率模塊,用于根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率,其中,i為正整數,i小于或等于M,M為所述標志物的數量,N為所述采樣樣本的數量;距離模塊,用于根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離,其中,a,b均為正整數,a,b均小于或等于M;坐標值模塊,用于將所有的兩個標志物之間的距離和降維后的維度作為多維標度算法的輸入,從而獲得每個標志物的坐標值;散點圖模塊,用于根據每個標志物的費舍爾比率獲得每個標志物在散點圖上的大小,并根據每個標志物的坐標值獲得每個標志物在散點圖上的坐標。其中,所述裝置還包括歸一化模塊,所述歸一化模塊用于根據所述第i個標志物的多個采樣樣本進行歸一化計算,以得到多個歸一化后的采樣樣本;所述費舍爾比率模塊用于根據第i個標志物的多個歸一化后的采樣樣本計算所述第i個標志物的費舍爾比率。其中,所述歸一化模塊具體用于根據進行歸一化計算,以得到多個歸一化后的采樣樣本,其中,Xi為所述第i個標志物的多個采樣樣本所組成的向量,ui為所述第i個標志物的多個采樣樣本的平均值,ρi為所述第i個標志物的多個采樣樣本的標準差,X′i為多個歸一化后的采樣樣本所組成的向量。其中,所述費舍爾比率模塊包括:第一計算單元,用于根據求出第i個標志物中類別為0的采樣樣本的平均值,其中,j為第i個標志物中采樣樣本的序號,Yj為第i個標志物中第j個采樣樣本的類別,當Yj=0時,第j個采樣樣本的類別為0,當Yj=1時,第j個采樣樣本的類別為1,X′ij為第i個標志物的第j個歸一化后的采樣樣本的值,m0為第i個標志物中類別為0的采樣樣本的平均值;第二計算單元,用于根據求出第i個標志物中類別為0的采樣樣本的標準差,其中,v0為第i個標志物中類別為0的采樣樣本的標準差;第三計算單元,用于根據求出第i個標志物中類別為1的采樣樣本的平均值,其中,m1為第i個標志物中類別為1的采樣樣本的平均值;第四計算單元,用于根據求出第i個標志物中類別為1的采樣樣本的標準差,其中,v1為第i個標志物中類別為1的采樣樣本的標準差;第五計算單元,用于根據計算第i個標志物的費舍爾比率。其中,所述距離模塊具體用于根據計算出第a個標志物和第b個標志物之間的距離,其中,j為采樣樣本的序號,X'aj為所述第a個標志物第j個歸一化后的采樣樣本的值,X′bj為所述第b個標志物第j個歸一化后的采樣樣本的值,Dab為第a個標志物和第b個標志物之間的距離。其中,所述降維后的維度為2維或者3維。其中,每個標志物的費舍爾比率與每個標志物在散點圖上的大小成正比例。實施本專利技術實施例,通過計算每個標志物的費舍爾比率從而獲得每個標志物在散點圖上的大小,又通過將所有的兩個標志物之間本文檔來自技高網...
    一種標志物相關性檢測方法以及裝置

    【技術保護點】
    一種標志物相關性檢測方法,其特征在于,包括:根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率,其中,i為正整數,i小于或等于M,M為所述標志物的數量,N為所述采樣樣本的數量;重復上一個步驟,直到求出每個標志物的費舍爾比率;根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離,其中,a,b均為正整數,a,b均小于或等于M;重復上一個步驟,直到求出任意兩個標志物之間的距離;將所有的兩個標志物之間的距離和降維后的維度作為多維標度算法的輸入,從而獲得每個標志物的坐標值;根據每個標志物的費舍爾比率獲得每個標志物在散點圖上的大小,并根據每個標志物的坐標值獲得每個標志物在散點圖上的坐標。

    【技術特征摘要】
    1.一種標志物相關性檢測方法,其特征在于,包括:根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率,其中,i為正整數,i小于或等于M,M為所述標志物的數量,N為所述采樣樣本的數量;重復上一個步驟,直到求出每個標志物的費舍爾比率;根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離,其中,a,b均為正整數,a,b均小于或等于M;重復上一個步驟,直到求出任意兩個標志物之間的距離;將所有的兩個標志物之間的距離和降維后的維度作為多維標度算法的輸入,從而獲得每個標志物的坐標值;根據每個標志物的費舍爾比率獲得每個標志物在散點圖上的大小,并根據每個標志物的坐標值獲得每個標志物在散點圖上的坐標;所述根據第a個標志物的多個采樣樣本和第b個標志物的多個采樣樣本計算出第a個標志物和第b個標志物之間的距離具體為:根據計算出第a個標志物和第b個標志物之間的距離,其中,j為采樣樣本的序號,為所述第a個標志物第j個歸一化后的采樣樣本的值,為所述第b個標志物第j個歸一化后的采樣樣本的值,Dab為第a個標志物和第b個標志物之間的距離。2.根據權利要求1所述的方法,其特征在于,根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率之前包括:根據所述第i個標志物的多個采樣樣本進行歸一化計算,以得到多個歸一化后的采樣樣本;根據第i個標志物的多個采樣樣本計算所述第i個標志物的費舍爾比率具體為:根據第i個標志物的多個歸一化后的采樣樣本計算所述第i個標志物的費舍爾比率。3.根據權利要求2所述的方法,其特征在于,根據所述第i個標志物的多個采樣樣本進行歸一化計算,以得到多個歸一化后的采樣樣本具體為:根據進行歸一化計算,以得到多個歸一化后的采樣樣本,其中,Xi為所述第i個標志物的多個采樣樣本所組成的向量,ui為所述第i個標志物的多個采樣樣本的平均值,ρi為所述第i個標志物的多個采樣樣本的標準差,Xi'為多個歸一化后的采樣樣本所組成的向量。4.根據權利要求3所述的方法,其特征在于,根據第i個標志物的多個歸一化后的采樣樣本計算所述第i個標志物的費舍爾比率具體為:根據求出第i個標志物中類別為0的采樣樣本的平均值,其中,j為第i個標志物中采樣樣本的序號,Yj為第i個標志物中第j個采樣樣本的類別,當Yj=0時,第j個采樣樣本的類別為0,當Yj=1時,第j個采樣樣本的類別為1,為第i個標志物的第j個歸一化后的采樣樣本的值,m0為第i個標志物中類別為0的采樣樣本的平均值;根據求出第i個標志物中類別為0的采樣樣本的標準差,其中,v0為第i個標志物中類別為0的采樣樣本的標準差;根據求出第i個標志物中類別為1的采樣樣本的平均值,其中,m1為第i個標志物中類別為1的采樣樣本的平均值;根據求出第i個標志物中類別為1的采樣樣本的標準差,其中,v1為第i個標志物中類別為1的采樣樣本的標準差;根據計算第i個標志物的費舍爾比率。5.根據權利要求1至4任一權利要求所述的方法,其特征在于,所述降維后的維度為2維...

    【專利技術屬性】
    技術研發人員:周豐豐孟慶漢
    申請(專利權)人:深圳先進技術研究院
    類型:發明
    國別省市:廣東;44

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码精品人妻一区二区三区免费 | 亚洲AV无码久久精品狠狠爱浪潮| 亚洲国产成人无码AV在线影院 | 亚洲午夜无码久久久久小说| 热の无码热の有码热の综合| 无码人妻精品一区二区三区99仓本 | 亚洲∧v久久久无码精品| 亚洲精品自偷自拍无码| 亚洲av中文无码乱人伦在线播放| 亚洲日韩精品A∨片无码加勒比| 日韩精品无码一区二区三区四区| 免费无码成人AV在线播放不卡 | 亚欧免费无码aⅴ在线观看| 无码任你躁久久久久久久| 日韩放荡少妇无码视频| 无码国产精品一区二区免费vr| 亚洲国产成人精品无码久久久久久综合| 99精品国产在热久久无码| 亚洲国产AV无码专区亚洲AV| 久久精品?ⅴ无码中文字幕| 精品无码黑人又粗又大又长 | 久久亚洲精品中文字幕无码| 国产高清无码二区 | 国产在线无码制服丝袜无码| 亚洲av片不卡无码久久| 色AV永久无码影院AV| 四虎成人精品无码| 亚洲AV无码久久精品色欲| 国产乱人无码伦av在线a| 亚洲va无码va在线va天堂| 国产乱人无码伦av在线a| 亚洲av无码专区国产乱码在线观看 | 亚洲午夜成人精品无码色欲| 人妻丰满AV无码久久不卡| 色综合久久无码中文字幕| 久久精品aⅴ无码中文字字幕重口 久久精品国产亚洲AV无码娇色 | 久久久久成人精品无码中文字幕 | 亚洲AV无码一区二区三区电影| 久久久久亚洲AV片无码下载蜜桃 | 无码国产精品一区二区免费16| 色爱无码AV综合区|