System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
【】本專利技術涉及網絡表示的,特別是基于語義和結構聚合的異質網絡表示方法的。
技術介紹
0、
技術介紹
1、網絡作為描述真實世界復雜系統的有效工具,具有捕獲綜合信息的獨特優勢,其中實體被映射到節點,實體之間的各種關系被抽象為邊。由于實體和實體之間的關系類型復雜多樣,傳統的同質網絡采用單一的連邊方式無法準確的描述現實中的各種聯系。異質網絡是指節點和邊具有多種類型的網絡,其特點包括節點和邊的多樣性、結構和語義的復雜性等。相比于同質網絡,異質網絡需要考慮不同類型節點和邊之間的自身特征和相互交互關系。實際上,大多數網絡都是異質的,同時存在多種類型的節點和關系,如社交網絡、學術網絡、交通網絡和生物網絡等。異質網絡包含豐富的語義信息和全面的結構信息,可以整合各種實體和它們之間的復雜交互。通過提取異質網絡中豐富的信息和復雜的關聯,可以獲得更精確的數據建模和分析。
2、異質網絡表示學習是網絡分析領域中的一個重要研究方向,它旨在將復雜異質網絡中的節點和邊映射到低維向量空間中,以便于進行各種數據挖掘和機器學習任務。異質網絡豐富的節點類型和邊類型,提供了更豐富的信息表示和分析能力。在網絡表示時為了獲取更全面的異質網絡信息,一些方法試圖通過元路徑或元圖來挖掘網絡中豐富的語義信息。han采用一種注意機制來學習鄰居節點和元路徑的權值,有效地聚合了異質網絡節點特征和語義信息。magnn注重元路徑上中間節點的內容特征,通過人工定義的元路徑聚合異質網絡詳細的語義信息。同時,網絡中的每個節點都具有不同的特征,因此一些工作挖掘節點本身的屬性
3、但上述方案只是單方面聚合異質網絡的語義信息或結構信息,或者探索節點之間的不同特征表示,尋找節點之間的相似性。而對于異質網絡表示,節點信息、語義鄰居和高階鄰居可以從不同的方面反映網絡特征,這對提高模型的性能是必不可少的。忽略元路徑實例所表達的語義差異可能會導致語義信息挖掘不足。此外,從網絡結構的角度來看,現有的模型主要考慮目標節點與相鄰節點之間的連接,很少討論高階鄰域信息,這限制了網絡全局結構的表達。
技術實現思路
0、
技術實現思路
1、本專利技術的目的就是解決現有技術中的問題,提出基于語義和結構聚合的異質網絡表示方法,能夠綜合考慮異質網絡的語義信息和高階信息,融合元路徑實例所表達的詳細語義信息,對網絡的高階關系進行建模,聚合網絡高階信息,獲得更合適的節點表示,生成合適的節點表示向量,提高下游任務的準確率。
2、為實現上述目的,本專利技術提出了基于語義和結構聚合的異質網絡表示方法,包括以下步驟:
3、s1:輸入異質網絡數據,進行數據預處理,根據網絡特征定義相關元路徑p;
4、s2:根據節點異質特征,對網絡中節點的異質信息進行編碼;
5、s3:確定節點特征權重,獲得異質節點的統一編碼;
6、s4:獲取節點基于語義的向量表示:
7、s41:根據定義的元路徑提取所有可能元路徑實例;
8、s42:采用bi-lstm技術獲得每條元路徑實例的編碼表示,并學習元路徑實例的權重表示;
9、s43:利用attention機制學習不同元路徑對目標節點的影響權重,并融合步驟s43中的元路徑實例表示,生成節點基于語義的向量表示;
10、s5:構建高階結構子圖,對子圖進行基于高階關系類型的融合編碼,學習網絡高階關系表示,生成節點基于結構編碼表示;
11、s6:將步驟s4和步驟s5獲得的節點表示向量拼接作為最終的節點表示向量。
12、作為優選,所述步驟s2中,對不同特征空間的向量通過公式h′v=wxhν變換到統一空間。
13、作為優選,所述步驟s3中,學習節點特征權重,獲得異質節點的編碼表示,采用一種注意機制來衡量異質信息對目標節點的重要性:
14、
15、其中,表示類型x的內容對節點v的重要程度,代表節點v特征屬性的數據形式為x的權重,并使用softmax函數歸一化;
16、最后,作為節點融合異質內容信息的嵌入表示。
17、作為優選,所述步驟s41中,元路徑實例可以由不同類型的鄰居節點組成并提供不同的語義表達。
18、作為優選,所述步驟s42中,元路徑實例的編碼表示通過在元路徑上聚合不同的鄰居節點獲取,采用bi-lstm對自然語言處理中的上下文信息進行建模和建模網絡中節點之間的語義信息,其編碼過程如下:
19、
20、eu表示節點u的多模態編碼,是權重矩陣,是偏置向量,是前向編碼結果,同理為后向編碼結果,將兩者連接起來作為元路徑實例編碼表示,利用注意機制學習不同實例對目標節點的不同權重:
21、
22、代表節點v引導的第i個元路徑實例的編碼向量,i表示同一元路徑下的不同實例數,at表示元路徑實例的特征向量,是元路徑實例對目標節點的重要程度表示,pv是元路徑編碼向量。
23、作為優選,所述步驟s43中,得到元路徑編碼向量pv后,利用注意機制學習不同元路徑對目標節點的影響權重并融合步驟s42中的元路徑實例表示,pv作為節點基于語義的向量表示:
24、
25、作為優選,所述步驟s5中,生成基于高階信息的向量表示:
26、s51:構建一個基于目標節點高階鄰居的結構子圖,通過計算距離目標節點的步長,得到目標節點的高階鄰居,由此構建出k階結構子圖;
27、s52:生成基于高階關系的節點表示向量,得到目標節點v在關系類型r下的所有鄰居節點信息聚合:
28、
29、其中aggregator為聚合函數,可以是mean、max或sum等,表示關系為r的目標節點v的鄰居節點集合,目標節點v的表示為各階關系的嵌入融合;不同階關系類型對目標節點影響不同,選擇注意機制學習不同階的鄰居影響:
30、
31、其中,表示向量訓練參數,wr表示矩陣訓練參數,上標代表向量或矩陣轉置;
32、目標節點v的整體關系表示為:
33、
34、αr表示關系類型r對嵌入重要性的超參數,表示特征變換矩陣。
35、本專利技術的有益效果:本專利技術同時聚合了異質網絡的語義信息和高階鄰居信息,首先,將節點的特征被映射到相同的維度空間,以方便節點的異質信息描述,在語義表示本文檔來自技高網...
【技術保護點】
1.基于語義和結構聚合的異質網絡表示方法,其特征在于:包括以下步驟:
2.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟S2中,對不同特征空間的向量通過公式h′v=wxhν變換到統一空間。
3.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟S3中,學習節點特征權重,獲得異質節點的編碼表示,采用一種注意機制來衡量異質信息對目標節點的重要性:
4.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟S41中,元路徑實例可以由不同類型的鄰居節點組成并提供不同的語義表達。
5.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟S42中,元路徑實例的編碼表示通過在元路徑上聚合不同的鄰居節點獲取,采用Bi-LSTM對自然語言處理中的上下文信息進行建模和建模網絡中節點之間的語義信息,其編碼過程如下:
6.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟S43中,得到元路徑編碼向量pv后,利用注意機制
7.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟S5中,生成基于高階信息的向量表示:
...【技術特征摘要】
1.基于語義和結構聚合的異質網絡表示方法,其特征在于:包括以下步驟:
2.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟s2中,對不同特征空間的向量通過公式h′v=wxhν變換到統一空間。
3.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟s3中,學習節點特征權重,獲得異質節點的編碼表示,采用一種注意機制來衡量異質信息對目標節點的重要性:
4.如權利要求1所述的基于語義和結構聚合的異質網絡表示方法,其特征在于:所述步驟s41中,元路徑實例可以由不同類型的鄰居節點組成并提供不同的語義表達。
5.如權利要...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。