• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于動態同步模型的社區檢測方法技術

    技術編號:11039903 閱讀:131 留言:0更新日期:2015-02-12 02:40
    本發明專利技術屬于網絡數據挖掘領域,具體涉及一種基于動態同步模型的社區檢測方法,首先讀取社交網絡數據,然后根據社交網絡圖進行網絡矢量化,得到矢量化后的一維坐標序列;再設置同步參數計算同步范圍,進行同步聚類:每個節點根據擴展的動態同步模型在同步范圍內進行同步,直到達到局部同步狀態,根據各節點的坐標位置進行社區劃分,計算該劃分的模塊度,然后不斷增加同步參數,執行新一輪的同步聚類過程,直到同步范圍覆蓋所有節點。通過kuramoto模型對網絡中的節點進行聚類,能夠對鏈接密度進行精準的描述,有效的反應網絡鏈接密度的差異,實現社交網絡社區結構的自動檢測,并對社區檢測結果進行選擇和優化。

    【技術實現步驟摘要】
    -種基于動態同步模型的社區檢測方法
    本專利技術屬于網絡數據挖掘領域,具體涉及一種基于動態同步模型的社區檢測方 法。
    技術介紹
    數據挖掘(DataMining)是指從大量數據中提取隱含的、未知的、有潛在應用價值 的信息或模式的過程。聚類是數據挖掘領域中一種重要的分析技術,根據數據之間在預先 制定的屬性上的相似性聚集成簇。聚類的目標是將有限個未知標簽的數據劃分成有限個離 散數據集合的形式,它沒有可供學習訓練的數據,可用的只有數據點本身的特征和可計算 數據點之間相似關系的相似性度量規則,因此選擇合適的相似性度量規則是非常重要的環 節。常用的相似性度量包括歐氏距離、馬氏距離、核距離、海明威距離等。 在過去十年中,數據聚類吸引了研究人員的廣泛關注,并提出一系列的聚類算法。 這些算法可以分為如下幾類:基于劃分的聚類算法、基于密度的聚類算法,基于層次的聚類 算法,基于模型的聚類算法等等。基于劃分的聚類方法直接將數據空間中的一組數據劃分 為不相連的一組子空間數據。基于層次的聚類方法是另外一種比較成熟的聚類方法。在初 始狀態時每個樣本都是作為一個類存在的,將距離最近的兩個類合并成一個類,重復迭代 直至所有的類都歸為一類;或者初始狀態時所有的樣本點是屬于同一個類的,逐漸細分為 越來越小的類,最終每個類中只含有一個樣本。基于密度的聚類方法是一種專門針對密度 數據提出的聚類方法,該方法使用數據點的密度特征作為聚類特征,將具有相似密度特征 的樣本歸為一類。基于模型的方法為每個簇假定了一個模型,尋找數據對給定模型的最佳 擬合。基于模型的算法可能性通過構建反映數據點空間分布的密度函數來定位聚類。 傳統的基于kuramoto模型的社區檢測算法-SYN算法-首先對網絡節點進 行預處理:使用節點間的結構相似度描述鏈接密度,并利用OPTICS算法,將各節點進行排 序,排序結果為一個一維坐標序列,同時保證鏈接密度大的節點距離較近。然后進行同步聚 類:將每個對象與其e-鄰域內進行同步調整,對調整坐標后的所有節點重新進行社團劃 分,將距離小于e的節點判定為同一個社團。得到社團劃分結果后,計算其模塊度。在不 斷增加鄰域半徑e值的同步過程中,得到一系列聚類結果,選擇其中模塊度最大的作為最 優聚類結果。 傳統的基于kuramoto模型的SYN算法在對鏈接密度的描述不夠精確,計算出結構 相似度數值區間狹窄,不能有效反映網絡鏈接密度差異。同時利用kuramoto模型進行局部 同步時僅考慮e_鄰域內同步,未考慮關系密切的其他節點。另外在同步處理之后,沒有 對微小社區進行后續處理,導致大量微小社區存在并使得社區檢測結果不夠準確。
    技術實現思路
    本專利技術的目的在于針對現有技術存在的缺陷和不足,提供一種基于動態同步模型 的社區檢測方法,該方法能夠對鏈接密度進行精確的描述,并有效反映網絡鏈接密度的差 異。 為實現上述目的,本專利技術采用以下技術方案:包括以下步驟: 步驟A,構造網絡圖:讀取網絡數據,構造以用戶為節點,用戶關系為邊的網絡圖; 步驟B,網絡矢量化:將步驟A所得網絡圖中各節點通過OPTICS算法進行矢量化, 將網絡中各節點映射到一個一維坐標序列中,為后續的同步聚類做準備,具體步驟為: 步驟B1,首先對網絡利用節點相似性描述網絡中鏈接密度,計算各邊(X,y)的節 點相似度,定義本文檔來自技高網
    ...
    一種基于動態同步模型的社區檢測方法

    【技術保護點】
    一種基于動態同步模型的社區檢測方法,其特征在于,包括以下步驟:步驟A,構造網絡圖:讀取網絡數據,構造以用戶為節點,用戶關系為邊的網絡圖;步驟B,網絡矢量化:將步驟A所得網絡圖中各節點通過OPTICS算法進行矢量化,將網絡中各節點映射到一個一維坐標序列中,為后續的同步聚類做準備,具體步驟為:步驟B1,首先對網絡利用節點相似性描述網絡中鏈接密度,計算各邊(x,y)的節點相似度,定義;其中τ(x)表示節點x的鄰域,包含x和x的鄰居節點,τ(y)表示節點y的鄰域,包含y和y的鄰居節點;degree(x)表示節點x的度,degree(y)表示節點y的度;步驟B2,利用節點相似度定義和OPTICS算法,獲得節點序列;步驟B3,根據獲得的節點序列,將網絡中的每個節點平均映射到區間[0,1)上,每個節點對應一個一維坐標,即實現整個網絡的矢量化;步驟C,執行同步聚類:設置初始同步參數ε,確定同步范圍,每個節點在其同步范圍內進行同步聚類,直至達到全局同步,根據同步坐標位置進行社區劃分,并計算該社區劃分的模塊度;不斷增加同步半徑,執行同步聚類,直至同步半徑覆蓋所有節點。

    【技術特征摘要】
    1. 一種基于動態同步模型的社區檢測方法,其特征在于,包括以下步驟: 步驟A,構造網絡圖:讀取網絡數據,構造以用戶為節點,用戶關系為邊的網絡圖; 步驟B,網絡矢量化:將步驟A所得網絡圖中各節點通過OPTICS算法進行矢量化,將網 絡中各節點映射到一個一維坐標序列中,為后續的同步聚類做準備,具體步驟為: 步驟B1,首先對網絡利用節點相似性描述網絡中鏈接密度,計算各邊(x,y)的節點相 似度,定義 ^ y;其中T (x)表示節點X的鄰域,包含X和X的鄰居節點,T (y)表示節點y的鄰域,包 含y和y的鄰居節點;degree (x)表示節點x的度,degree (y)表示節點y的度; 步驟B2,利用節點相似度定義和OPTICS算法,獲得節點序列; 步驟B3,根據獲得的節點序列,將網絡中的每個節點平均映射到區間[0,1)上,每個節 點對應一個一維坐標,即實現整個網絡的矢量化; 步驟C,執行同步聚類:設置初始同步參數e,確定同步范圍,每個節點在其同步范圍 內進行同步聚類,直至達到全局同步,根據同步坐標位置進行社區劃分,并計算該社區劃分 的模塊度;不斷增加同步半徑,執行同步聚類,直至同步半徑覆蓋所有節點。2. 根據權利要求1所述的一種基于動態同步模型的社區檢測方法,其特征在于,步驟C 所述同步聚類和社區劃分包括如下步驟: 步驟C1,初始化同步參數e值為,計算各節點x的e-鄰域集合化)和密切節 點集合Close (x),將兩個集合進行合并組成節點x的同步范圍RE (x); Ne (x) = {y G X|dist(y, x) ^ e } Close (x) = {y G X|Vxy G top 20% of Vx} RE (x) = NE (x) U Close (x) 其中,dist(y, x)表示節點x, y映...

    【專利技術屬性】
    技術研發人員:董學文楊超盛立杰王超姚青松李興華曾勇姜奇
    申請(專利權)人:西安電子科技大學
    類型:發明
    國別省市:陜西;61

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲成a人片在线观看天堂无码 | 国产成人无码av在线播放不卡| 无码人妻少妇色欲AV一区二区| 久久综合精品国产二区无码| 性色AV无码中文AV有码VR| 国产亚洲精品无码专区| 黑人巨大无码中文字幕无码| 久久精品成人无码观看56| 无码国产成人午夜电影在线观看| 无码精品A∨在线观看| 久久久久无码国产精品不卡| 亚洲精品无码久久久久秋霞| 亚洲AV人无码综合在线观看| 亚洲国产精品无码久久久久久曰 | 伊人无码精品久久一区二区 | 伊人久久综合精品无码AV专区 | 久久精品无码专区免费| 亚洲午夜成人精品无码色欲| 日韩人妻无码精品一专区| 波多野结衣AV无码| 国产成人无码网站| 精品亚洲av无码一区二区柚蜜| 久久久久av无码免费网| 久久老子午夜精品无码怎么打| 丝袜无码一区二区三区| 亚洲精品无码专区久久同性男| 精品久久久久久无码人妻| 成人免费无码大片a毛片软件| 无码精品A∨在线观看十八禁| 乱色精品无码一区二区国产盗 | 精品久久久久久无码人妻中文字幕 | 青青草无码免费一二三区| 中文无码喷潮在线播放| 最新高清无码专区| 亚洲动漫精品无码av天堂| 无码人妻丰满熟妇区五十路百度| 亚洲精品无码不卡在线播HE| 亚洲AV中文无码字幕色三| 秋霞鲁丝片Av无码少妇| 在人线av无码免费高潮喷水| 无码午夜人妻一区二区不卡视频|