• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>湖南大學專利>正文

    整合拓撲屬性和功能的蛋白質生物網絡模體識別方法技術

    技術編號:9569204 閱讀:290 留言:0更新日期:2014-01-16 02:43
    本發明專利技術公開了一種整合拓撲屬性和功能的蛋白質生物網絡模體識別方法,本發明專利技術從模體的生物學意義出發,通過整合邊聚集系數和GO短語的語義相似性來綜合評估蛋白質相互作用的生物顯著性,提出了一種整合拓撲屬性和功能的蛋白質生物網絡模體識別方法(Ecc-GOSS)。本發明專利技術實現簡單,只需根據PPI信息和基因本體論信息就能夠較準確地識別大量的具有生物意義的網絡模體,且對蛋白質相互作用大規模數據中普遍存在的比例較高的假陽性具有很好的健壯性。

    【技術實現步驟摘要】
    【專利摘要】本專利技術公開了一種,本專利技術從模體的生物學意義出發,通過整合邊聚集系數和GO短語的語義相似性來綜合評估蛋白質相互作用的生物顯著性,提出了一種(Ecc-GOSS)。本專利技術實現簡單,只需根據PPI信息和基因本體論信息就能夠較準確地識別大量的具有生物意義的網絡模體,且對蛋白質相互作用大規模數據中普遍存在的比例較高的假陽性具有很好的健壯性。【專利說明】
    本專利技術屬于系統生物學領域,涉及一種。
    技術介紹
    在后基因組時代,為更好地理解生物分子交互和運作的機制,功能基因組學研究的主要目標是識別和分析細胞環境中的分子相互作用。蛋白質相互作用是一種特定類型分子相互作用,在傳送信號、構建分子機器、參與酶反應等生物過程中起著核心作用。近年來,隨著高通量蛋白質組技術的發展,可獲得的蛋白質相互作用數據迅速增長。蛋白質相互作用被構建為無向圖(其中頂點對應蛋白質,邊對應蛋白質之間的相互作用)有助于從網絡水平上理解細胞機制的基本構件和組織。蛋白質相互作用網絡類似于復雜網絡,擁有小世界和無尺度等全局特性。而在2002年由R.Milo等首次提出的網絡模體則是其中非常重要的一種局部性質,網絡模體定義為一種在給定網絡中頻繁出現的連通子圖,并且其出現的次數要多于在相應的隨機網絡中的次數,被認為是復雜網絡的基本構件塊。所以,有效地識別網絡模體對預測蛋白質相互作用、預測關鍵蛋白質及解釋特定的生物進程具有十分重要的意義。網絡模體發現的計算復雜度非常高,它涉及到子圖的同構測試及需要產生大量的隨機網絡來確定子圖的唯一性。現有的網絡模體發現方法主要有精確的枚舉法和近似的采樣方法。窮盡遞歸搜索(ERS)、枚舉子圖(ESU)和緊湊的拓撲模體屬于精確方法。邊采樣方法(ESA)、頂點采樣方法(RAND-ESU)及樹過濾搜索方法(NEM0FINDER)屬于近似方法。最近,Kim等人首次定義生物網絡模體為生物上具有顯著性的小的連通子圖,并指出傳統結構上的網絡模體不足以解釋模體的生物意義,因為部分結構上的非模體也具有生物意義;為有效的發現生物網絡模體,Kim提出了 EDGEGO-BNM,EDGEBETWEENNESS-BNM,NMF-BNM,NMFGO-B匪和V0LTAGE-B匪五種方法,實驗結果表明,基于蛋白質對的共同GO短語深度的EDGEG0-BNM方法和基于邊介數的EDGEBETWEENNESS-BNM方法評價結果優于其他方法。盡管Kim等提出的方法能較好的發現生物網絡模體,但仍有幾個挑戰是研究者必須面對的。首先,目前每一個物種的蛋白質相互作用數據是不完整的;其次,蛋白質相互作用數據存在大量假陽性,特別是從大規模高通量實驗得到的數據。對于假陽性,一般是通過使用不同的權重方法來評估相互作用的可靠性。此外,網絡模體被認為是復雜網絡的基本構件塊,且樹形結構的子圖通常不是模體,那么網絡模體中的相互作用是傾向于形成高密度連通的簇。因此,有必要設計一種。
    技術實現思路
    本專利技術所要解決的技術問題是提供一種,該只需根據PPI信息和基因本體論信息就能夠較準確地識別大量的具有生物意義的網絡模體,且對蛋白質相互作用大規模數據中普遍存在的比例較高的假陽性具有很好的健壯性。專利技術的技術解決方案如下:一種,包括以下步驟:I)建立蛋白質相互作用無向圖:輸入一組蛋白質相互作用信息,過濾掉其中的重復相互作用和自相互作用,建立蛋白質相互作用無向圖G ;重復相互作用指一對蛋白質相互作用信息被記錄了 2次及以上【其被多種實驗方法所證實而得到】; 其中,蛋白質相互作用信息指蛋白質-蛋白質關聯及其關聯可靠性計分的集合;每一對蛋白質-蛋白質關聯的成員是具有直接相互作用的兩個蛋白質;2)計算蛋白質相互作用無向圖G中每條邊的生物顯著性值;3)將蛋白質相互作用無向圖G中的每條邊按照生物顯著性值以非遞減的順序排序,刪除最前的r條的邊【即較小的生物顯著性值的r條邊】,得到圖G’ ;4)采用ESU方法枚舉圖G’中所有k個頂點的導出子圖,所有被查找到的子圖即所要識別的生物網絡模體,整個識別過程結束;所述的ESU方法 為枚舉子圖法。所述的生物顯著性值由下式計算:Λ(?,ν) = OT x[.s./(",v)f 5其中α和β都是控制邊聚集系數與語義相似性的相對重要性的參數,α和β分別取值為I和2【使查找到的子圖在復合物與功能模塊中都具有較高的比例】; Z1-S) +14,為邊聚集系數,有?丨1;” = 1?Λ,; CU,V'SlgJss (U,v)為語義相似性,有S_,V) =;通過調整參數r,使得在圖G'中所查找到的子圖數為原圖G中子圖數的30%;k取值為4和5,即查找頂點數為4和5的導出子圖。從計算角度來看,模體是相對于隨機網絡而言在真實網絡中頻繁出現的子圖,而從生物學角度來看,模體是指生物網絡中的基本構件塊。這里參照Kim等提出的生物網絡模體的定義,即生物網絡模體的發現是盡可能的找到生物上具有顯著性的小的連通子圖,它不涉及子圖的同構測試,也不需要產生大量的隨機網絡來進行子圖的過表達測試。本專利技術通過在原網絡中去掉一些生物上非顯著的邊來減少查詢的子圖數目同時增加了生物網絡模體的發現比例。例如,如果去掉20%左右的邊,那么原網絡中的子圖數將減少到30%。該方法通過整合邊聚集系數和GO短語的語義相似性來綜合評估蛋白質對的生物顯著性,然后根據該值的大小去掉生物上非顯著性的邊。該方法的基本思想是:(I)生物網絡模體的相互作用傾向于形成高密度連通的簇;(2)蛋白質對的GO語義相似性值越大,則兩個蛋白質之間發生相互作用的概率越高。事實上,在GO短語所表示的DAG圖中,每一個短語可能有多條不同長度的路徑到達根短語,因此,短語的深度不是一個精確的特異性的指標。而且,邊介數是一種全局度量,所需的計算復雜度非常高。為了克服以上挑戰,本專利技術提出了一種新的方法Ecc-GOSS:通過整合邊聚集系數和GO短語的語義相似性來綜合評價蛋白質相互作用的生物顯著性,邊聚集系數從拓撲結構上能有效地描述兩個蛋白質共簇的概率,但它的有效性嚴重依賴于蛋白質相互作用網絡的可靠性,為此,引入GO短語的語義相似性,它能從功能上有效評估蛋白質相互作用的可靠程度。該方法不僅提高了計算效率,而且對于存在的假陽性數據提高了魯棒性。有益效果:本專利技術的(Ecc-GOSS),從模體的生物學意義出發,通過整合邊聚集系數和GO短語的語義相似性來綜合評估蛋白質對的生物顯著性,在拓撲屬性和生物功能兩方面得到了一個較好的融合。本專利技術實現簡單,只需根據PPI信息和基因本體論信息就能夠較準確地識別大量的具有生物意義的網絡模體,為進一步研究提供有價值的參考信息,且對蛋白質相互作用大規模數據中普遍存在的比例較高的假陽性具有很好的健壯性。實驗證明,Ecc-GOSS有效地克服了生物網絡中的假陽性數據,使查找到的子圖在復合物與功能模塊中都具有較高的比例,且相比于其他方法具有最高的GO短語聚類分數,具體實驗參數和對比表詳見實施例。【專利附圖】【附圖說明】圖1是本專利技術Ecc-GOSS的流程圖;圖2是蛋白質相互作用無向圖實例;圖3是6種非同構的4頂點子圖的形狀和標簽;圖4是6種方法在DIPCore netwrok中找到的4頂點的6種子圖的相對頻率;圖5是6種方法在Y2k網絡中找到的本文檔來自技高網
    ...

    【技術保護點】
    一種整合拓撲屬性和功能的蛋白質生物網絡模體識別方法,其特征在于,包括以下步驟:1)建立蛋白質相互作用無向圖:輸入一組蛋白質相互作用信息,過濾掉其中的重復相互作用和自相互作用,建立蛋白質相互作用無向圖G;重復相互作用指一對蛋白質相互作用信息被記錄了2次及以上;其中,蛋白質相互作用信息指蛋白質?蛋白質關聯及其關聯可靠性計分的集合;每一對蛋白質?蛋白質關聯的成員是具有直接相互作用的兩個蛋白質;2)計算蛋白質相互作用無向圖G中每條邊的生物顯著性值;3)將蛋白質相互作用無向圖G中的每條邊按照生物顯著性值以非遞減的順序排序,刪除最前的r條的邊,得到圖G’;4)采用ESU方法枚舉圖G′中所有k個頂點的導出子圖,所有被查找到的子圖即所要識別的生物網絡模體,整個識別過程結束;所述的ESU方法為枚舉子圖法。

    【技術特征摘要】

    【專利技術屬性】
    技術研發人員:駱嘉偉李光輝王偉勝江海劉智明蔡潔
    申請(專利權)人:湖南大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 人妻丰满熟妇AV无码片| 在线A级毛片无码免费真人| 精品无码一级毛片免费视频观看| 无码一区二区三区免费视频| 色欲AV无码一区二区三区| 无码国产精品一区二区免费| 台湾无码一区二区| 国产精品无码久久久久久| 成年无码av片在线| JLZZJLZZ亚洲乱熟无码| 久久久无码精品亚洲日韩京东传媒| 亚洲国产精品成人精品无码区 | 蜜芽亚洲av无码一区二区三区 | 国产爆乳无码视频在线观看| 亚洲av中文无码字幕色不卡 | 在线观看成人无码中文av天堂| 无码人妻久久一区二区三区| 国产丰满乱子伦无码专区| 中文字幕无码av激情不卡久久 | 深夜a级毛片免费无码| 免费无遮挡无码永久视频| 亚洲一级特黄无码片| 免费无码H肉动漫在线观看麻豆| 亚洲av无码专区亚洲av不卡| 日韩人妻无码精品久久免费一| 久久精品无码一区二区日韩AV| 少妇爆乳无码专区| 国产怡春院无码一区二区| 2021无码最新国产在线观看| 秋霞无码一区二区| 精品多人p群无码| 亚洲日韩乱码中文无码蜜桃| 久久精品无码专区免费青青| 免费精品无码AV片在线观看| 色偷偷一区二区无码视频| 日韩精品久久无码中文字幕| 亚洲熟妇无码久久精品| 曰产无码久久久久久精品| 国语成本人片免费av无码| 成人无码精品一区二区三区| 免费a级毛片无码a∨性按摩|