【技術實現步驟摘要】
-種基于動態同步模型的社區檢測方法
本專利技術屬于網絡數據挖掘領域,具體涉及一種基于動態同步模型的社區檢測方 法。
技術介紹
數據挖掘(DataMining)是指從大量數據中提取隱含的、未知的、有潛在應用價值 的信息或模式的過程。聚類是數據挖掘領域中一種重要的分析技術,根據數據之間在預先 制定的屬性上的相似性聚集成簇。聚類的目標是將有限個未知標簽的數據劃分成有限個離 散數據集合的形式,它沒有可供學習訓練的數據,可用的只有數據點本身的特征和可計算 數據點之間相似關系的相似性度量規則,因此選擇合適的相似性度量規則是非常重要的環 節。常用的相似性度量包括歐氏距離、馬氏距離、核距離、海明威距離等。 在過去十年中,數據聚類吸引了研究人員的廣泛關注,并提出一系列的聚類算法。 這些算法可以分為如下幾類:基于劃分的聚類算法、基于密度的聚類算法,基于層次的聚類 算法,基于模型的聚類算法等等。基于劃分的聚類方法直接將數據空間中的一組數據劃分 為不相連的一組子空間數據。基于層次的聚類方法是另外一種比較成熟的聚類方法。在初 始狀態時每個樣本都是作為一個類存在的,將距離最近的兩個類合并成一個類,重復迭代 直至所有的類都歸為一類;或者初始狀態時所有的樣本點是屬于同一個類的,逐漸細分為 越來越小的類,最終每個類中只含有一個樣本。基于密度的聚類方法是一種專門針對密度 數據提出的聚類方法,該方法使用數據點的密度特征作為聚類特征,將具有相似密度特征 的樣本歸為一類。基于模型的方法為每個簇假定了一個模型,尋找數據對給定模型的最佳 擬合。基于模型的算法可能性通過構 ...
【技術保護點】
一種基于動態同步模型的社區檢測方法,其特征在于,包括以下步驟:步驟A,構造網絡圖:讀取網絡數據,構造以用戶為節點,用戶關系為邊的網絡圖;步驟B,網絡矢量化:將步驟A所得網絡圖中各節點通過OPTICS算法進行矢量化,將網絡中各節點映射到一個一維坐標序列中,為后續的同步聚類做準備,具體步驟為:步驟B1,首先對網絡利用節點相似性描述網絡中鏈接密度,計算各邊(x,y)的節點相似度,定義;其中τ(x)表示節點x的鄰域,包含x和x的鄰居節點,τ(y)表示節點y的鄰域,包含y和y的鄰居節點;degree(x)表示節點x的度,degree(y)表示節點y的度;步驟B2,利用節點相似度定義和OPTICS算法,獲得節點序列;步驟B3,根據獲得的節點序列,將網絡中的每個節點平均映射到區間[0,1)上,每個節點對應一個一維坐標,即實現整個網絡的矢量化;步驟C,執行同步聚類:設置初始同步參數ε,確定同步范圍,每個節點在其同步范圍內進行同步聚類,直至達到全局同步,根據同步坐標位置進行社區劃分,并計算該社區劃分的模塊度;不斷增加同步半徑,執行同步聚類,直至同步半徑覆蓋所有節點。
【技術特征摘要】
1. 一種基于動態同步模型的社區檢測方法,其特征在于,包括以下步驟: 步驟A,構造網絡圖:讀取網絡數據,構造以用戶為節點,用戶關系為邊的網絡圖; 步驟B,網絡矢量化:將步驟A所得網絡圖中各節點通過OPTICS算法進行矢量化,將網 絡中各節點映射到一個一維坐標序列中,為后續的同步聚類做準備,具體步驟為: 步驟B1,首先對網絡利用節點相似性描述網絡中鏈接密度,計算各邊(x,y)的節點相 似度,定義 ^ y;其中T (x)表示節點X的鄰域,包含X和X的鄰居節點,T (y)表示節點y的鄰域,包 含y和y的鄰居節點;degree (x)表示節點x的度,degree (y)表示節點y的度; 步驟B2,利用節點相似度定義和OPTICS算法,獲得節點序列; 步驟B3,根據獲得的節點序列,將網絡中的每個節點平均映射到區間[0,1)上,每個節 點對應一個一維坐標,即實現整個網絡的矢量化; 步驟C,執行同步聚類:設置初始同步參數e,確定同步范圍,每個節點在其同步范圍 內進行同步聚類,直至達到全局同步,根據同步坐標位置進行社區劃分,并計算該社區劃分 的模塊度;不斷增加同步半徑,執行同步聚類,直至同步半徑覆蓋所有節點。2. 根據權利要求1所述的一種基于動態同步模型的社區檢測方法,其特征在于,步驟C 所述同步聚類和社區劃分包括如下步驟: 步驟C1,初始化同步參數e值為,計算各節點x的e-鄰域集合化)和密切節 點集合Close (x),將兩個集合進行合并組成節點x的同步范圍RE (x); Ne (x) = {y G X|dist(y, x) ^ e } Close (x) = {y G X|Vxy G top 20% of Vx} RE (x) = NE (x) U Close (x) 其中,dist(y, x)表示節點x, y映...
【專利技術屬性】
技術研發人員:董學文,楊超,盛立杰,王超,姚青松,李興華,曾勇,姜奇,
申請(專利權)人:西安電子科技大學,
類型:發明
國別省市:陜西;61
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。