本發明專利技術涉及特定計算系統及人工智能技術領域,具體公開了一種基于標簽傳播算法的社交網絡群體挖掘方法及系統,包括將社交網絡模型化為多節點網絡拓撲結構;基于節點的度中心性對多節點網絡拓撲結構進行群體初始化,以構建初始群體;初始群體中的所有節點均具有初始標簽;基于具有不同初始標簽的鄰居節點所對應的節點構建集合;基于節點的信息熵不斷更新集合中所有節點的初始標簽,直至多節點網絡拓撲結構中各節點的標簽不再改變或者達到最大迭代次數閾值;基于節點的標簽將節點劃分至對應的群組,從而獲得不同的群體;該方法采用的標簽傳播算法不依賴于任何先驗知識和預定義的目標函數,而僅考慮網絡節點的局部特征度中心性來進行計算,使得群體檢測更加準確和高效。使得群體檢測更加準確和高效。使得群體檢測更加準確和高效。
【技術實現步驟摘要】
一種基于標簽傳播算法的社交網絡群體挖掘方法及系統
[0001]本專利技術涉及特定計算系統及人工智能
,具體涉及一種基于標簽傳播算法的社交網絡群體挖掘方法及系統。
技術介紹
[0002]現實世界中社交網絡可由多節點網絡拓撲結構進行高度抽象,且其中存在的群體結構特性是多節點網絡拓撲結構中最顯著的特征;多節點網絡拓撲結構是根據不同的現實系統抽象出的多節點網絡拓撲結構拓撲結構特征,網絡中頂點和邊的特征可能隨時間進行動態演化并表現出不同的特性;隨著各個行業領域中多節點網絡拓撲結構數據的迅速增長以及研究該問題的挑戰性,對多節點網絡拓撲結構的研究吸引了計算機、數學、物理學及生物醫學等多個學科研究人員的關注,逐漸形成了一個熱門的交叉研究領域;近年來國內外學者在文獻中提出大量的群體挖掘算法來檢測多節點網絡拓撲結構中的群體結構。
[0003]群體挖掘算法可以檢測多節點網絡拓撲結構的群體結構并深入探索網絡的拓撲結構與隱含特性間的關聯,對于劃分后的群體結構可以用于挖掘社會網絡中具有相同興趣愛好的團體,在此基礎上進行個性化推薦;也可以用于搜索、推薦系統中實現信息過濾和話題推薦等功能,還可以用于分析生物網絡中的功能結構單元等;此外,多節點網絡拓撲結構中的群體挖掘算法已廣泛地應用于軍事協同作戰、個性化推薦、欺詐檢測和多智能體協作等多個信息化領域;多節點網絡拓撲結構中的群體挖掘算法作為研究多節點網絡拓撲結構的重要理論支撐,在云計算、人工智能等多個研究領域具有重要的理論意義和應用價值;然而大部分群體挖掘算法在準確性或效率上都不能達到良好的效果。
[0004]目前針對多節點網絡拓撲結構中群體挖掘的方法根據算法類型大體上包括基于層次劃分的算法和基于模塊度優化的算法;基于層次劃分的算法包括分裂式層次算法和凝聚式層次算法,以層次樹的思想在構造過程中指定評價指標選擇最優劃分結果;基于模塊度優化的算法是對目標函數模塊度進行最大值問題求解,從而取對應的如圖1所示的劃分結果;
[0005]但基于層次劃分的算法和基于模塊度優化的算法在大規模網絡數據上均不能檢測出良好的群體結構,或者需要提前定義目標函數或者其它難以優化的超參數,因此提出一種高效的群體挖掘算法來解決多節點網絡拓撲結構中的群體挖掘場景成為了亟待解決的問題。
技術實現思路
[0006]針對上述問題,本專利技術的一個目的是提供一種基于標簽傳播算法的社交網絡群體挖掘方法,該方法中采用的標簽傳播算法不依賴于任何先驗知識和預定義的目標函數,而僅考慮網絡節點的局部特征度中心性來進行計算,使得群體檢測更加準確和高效。
[0007]本專利技術的第二個目的是提供一種基于標簽傳播算法的社交網絡群體挖掘系統。
[0008]本專利技術所采用的第一個技術方案是:一種基于標簽傳播算法的社交網絡群體挖掘
方法,包括以下步驟:
[0009]S100:將社交網絡模型化為多節點網絡拓撲結構;
[0010]S200:基于節點的度中心性對多節點網絡拓撲結構進行群體初始化,以構建初始群體;所述初始群體中的所有節點均具有初始標簽;
[0011]S300:基于具有不同初始標簽的鄰居節點所對應的節點構建集合;;基于節點的信息熵不斷更新集合中所有節點的初始標簽,直至多節點網絡拓撲結構中各節點的標簽不再改變或者達到最大迭代次數閾值;
[0012]S400:基于節點的標簽將節點劃分至對應的群組,從而獲得不同的群體。
[0013]優選地,所述步驟S200包括:
[0014]計算多節點網絡拓撲結構中的所有節點的度中心性,基于度中心性將多節點網絡拓撲結構中的所有節點按照從大到小進行排序;基于節點的度中心性從大到小的順序,初始化每個節點所屬群體,以構建初始群體;當一個節點已作為鄰居節點被初始化,則該節點不再進行初始化。
[0015]優選地,所述節點的度中心性通過以下公式表示:
[0016][0017]式中,DC(v)為節點v的度中心性;d(v)為節點v的度,即節點v的鄰居節點的數量;為多節點網絡拓撲結構標準化系數;N為多節點網絡拓撲結構中的節點個數。
[0018]優選地,所述步驟S300中基于具有不同初始標簽的鄰居節點所對應的節點構建集合包括:
[0019]對于多節點網絡拓撲結構中的所有節點,如果當前節點的所有鄰居節點具有不同的初始標簽,則將該當前節點添加到集合S中。
[0020]優選地,所述步驟S300中基于信息熵更新集合中所有節點的初始標簽包括:
[0021]計算當前節點所對應的所有鄰居節點的信息熵,將所有鄰居節點中初始標簽相同的鄰居節點所對應的信息熵進行求和,以獲得多個信息熵和;選擇鄰居節點中信息熵和最大的初始標簽更新為當前節點的標簽。
[0022]優選地,所述節點的信息熵通過以下公式表示:
[0023][0024]式中,Entropy(v)為節點v的信息熵;DC(j)為節點j的度中心性;;j∈τ(v),τ(v)表示節點v的鄰居節點集合。
[0025]優選地,所述步驟S300中最大迭代次數閾值為100。
[0026]本專利技術所采用的第二個技術方案是:一種基于標簽傳播算法的社交網絡群體挖掘系統,包括建模模塊、初始化模塊、更新模塊和群體挖掘模塊;
[0027]所述建模模塊用于將社交網絡模型化為多節點網絡拓撲結構;
[0028]所述初始化模塊用于基于節點的度中心性對多節點網絡拓撲結構進行群體初始化,以構建初始群體;所述初始群體中的所有節點均具有初始標簽;
[0029]所述更新模塊用于基于具有不同初始標簽的鄰居節點所對應的節點構建集合;基
于節點的信息熵不斷更新集合中所有節點的初始標簽,直至多節點網絡拓撲結構中各節點的標簽不再改變或者達到最大迭代次數閾值;
[0030]所述群體挖掘模塊用于基于節點的標簽將節點劃分至對應的群組,從而獲得不同的群體。
[0031]優選地,所述初始化模塊執行以下操作:
[0032]計算多節點網絡拓撲結構中的所有節點的度中心性,基于度中心性將多節點網絡拓撲結構中的所有節點按照從大到小進行排序;基于節點的度中心性從大到小的順序,初始化每個節點所屬群體,以構建初始群體;當一個節點已作為鄰居節點被初始化,則該節點不再進行初始化。
[0033]優選地,所述更新模塊執行以下操作:
[0034]計算當前節點所對應的所有鄰居節點的信息熵,將所有鄰居節點中初始標簽相同的鄰居節點所對應的信息熵進行求和,以獲得多個信息熵和;選擇鄰居節點中信息熵和最大的初始標簽更新為當前節點的標簽。
[0035]上述技術方案的有益效果:
[0036](1)針對多節點網絡拓撲結構中的群體挖掘問題,本專利技術基于標簽傳播算法挖掘多節點網絡拓撲結構中的群體結構或者簇結構,可以快速高效地劃分不同群體邊界,尤其是大規模網絡結構。
[0037](2)針對標簽傳播算法存在的隨機性和不穩定性問題,本專利技術提出基于節點信息熵改進的標簽傳播過程,從而有效地提升標簽傳播本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種基于標簽傳播算法的社交網絡群體挖掘方法,其特征在于,,包括以下步驟:S100:將社交網絡模型化為多節點網絡拓撲結構;S200:基于節點的度中心性對所述多節點網絡拓撲結構進行群體初始化,以構建初始群體;所述初始群體中的所有節點均具有初始標簽;S300:基于具有不同初始標簽的鄰居節點所對應的節點構建集合;基于節點的信息熵不斷更新集合中所有節點的初始標簽,直至所述多節點網絡拓撲結構中各節點的標簽不再改變或者達到最大迭代次數閾值;S400:基于節點的標簽將節點劃分至對應的群組,從而獲得不同的群體。2.根據權利要求1所述的社交網絡群體挖掘方法,其特征在于,所述步驟S200包括:計算所述多節點網絡拓撲結構中的所有節點的度中心性,基于度中心性將多節點網絡拓撲結構中的所有節點按照從大到小進行排序;基于節點的度中心性從大到小的順序,初始化每個節點所屬群體,以構建初始群體;當一個節點已作為鄰居節點被初始化,則該節點不再進行初始化。3.根據權利要求2所述的社交網絡群體挖掘方法,其特征在于,所述節點的度中心性通過以下公式表示:式中,dC9v)為節點v的度中心性;d(v)為節點v的度,即節點v的鄰居節點的數量;為所述多節點網絡拓撲結構標準化系數;N為所述多節點網絡拓撲結構中的節點個數。4.根據權利要求1所述的社交網絡群體挖掘方法,其特征在于,所述步驟S300中基于具有不同初始標簽的鄰居節點所對應的節點構建集合包括::對于所述多節點網絡拓撲結構中的所有節點,如果當前節點的所有鄰居節點具有不同的初始標簽,則將該當前節點添加到集合S中。5.根據權利要求1所述的社交網絡群體挖掘方法,其特征在于,所述步驟S300中基于信息熵更新集合中所有節點的初始標簽包括:計算當前節點所對應的所有鄰居節點的信息熵,將所有鄰居節點中初始標簽相同的鄰居節點所對應的信息熵進行求和,以獲得多個信息熵和...
【專利技術屬性】
技術研發人員:沈夢家,張軍,張文金,
申請(專利權)人:中國船舶集團有限公司第七一九研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。