System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及一種人工智能領域,具體涉及一種層次實體鄰居多關系融合的知識圖譜補全方法。
技術介紹
1、知識圖譜(knowledge?graph)是一種采用結構化的事實表達方式,將現實世界中的事實用兩個實體以及其之間的關系組成的三元組來表示。隨著知識圖譜的規模不斷擴大,知識圖譜將越來越趨于不完整,存在大量缺失的、隱藏的事實。知識圖譜補全旨在尋找知識圖譜中缺失的部分,挖掘出其中隱藏的實體及其之間的關系,從而使知識圖譜蘊含的信息更加豐富完整。
2、現有的知識圖譜補全模型在鏈接預測中更注重實體間的關系建模,而忽視了實體與其關系表示之間的深度交互,無法充分捕捉關系在知識圖譜中的關鍵作用,存在處理實體與關系的深度融合方面的不足。且現有的知識圖譜補全模型在處理長路徑依賴的復雜關系時,長路徑的關系信息往往依賴復雜的語義;在處理跨越多跳實體時,往往無法有效提取遠距離實體之間的深層次關系信息,導致在大規模知識圖譜中,知識圖譜補全模型對全局語義的感知能力受限,進而影響了知識圖譜的整體預測效果。
技術實現思路
1、本專利技術的目的是提供一種層次實體鄰居多關系融合的知識圖譜補全方法,更好地實現實體與關系的交互,有效解決了現有模型在實體與關系深度融合上的不足,大幅提升了知識圖譜補全模型的預測性能。
2、為了達到上述目的,本專利技術提供了一種層次實體鄰居多關系融合的知識圖譜補全方法,具體步驟包括:
3、步驟1,劃分知識圖譜,將知識圖譜三元組中的頭實體作為中心實體,將尾實體作為
4、步驟2,對中心實體和鄰居實體進行聚合處理,獲得鄰居實體的自適應權重向量,并對鄰居實體進行加權聚合,獲得聚合后中心實體的鄰居信息;基于聚合后中心實體的鄰居信息、鄰居實體的自適應權重向量和中心實體進行聚合,獲得更新后中心實體的特征向量,完成中心實體、鄰居實體的聚合;
5、步驟3,將關系融合入中心實體中,獲得融合實體和關系信息的嵌入向量,完成實體鄰接關系的融合;
6、步驟4,根據融合實體和關系信息的嵌入向量,通過多頭自注意力機制,計算多頭自注意力的輸出矩陣;
7、步驟5,利用前饋神經網絡獲得編碼器的輸出矩陣;
8、步驟6,通過負采樣獲得損失函數并優化,計算損失函數的最小值,完成知識圖譜的補全。
9、可選地,在步驟2中,分別對中心實體和鄰居實體進行線性變換和縮放處理,獲得中心實體、鄰居實體經線性變換和縮放處理后的特征向量,可表示為:
10、h′v=w1hv
11、
12、式中,h′v為中心實體經線性變換和縮放處理后的特征向量,h′i為鄰居實體經線性變換和縮放處理后的特征向量,w1為線性變換的權重矩陣,d′i為歸一化處理后的第i個鄰居實體的度數信息;
13、通過聚合器對鄰居實體經線性變換和縮放處理后的特征進行聚合,獲得每個鄰居實體的自適應權重向量,可表示為:
14、
15、式中,為利用第k個聚合器計算第i個鄰居實體的自適應權重向量,w2為線性變換的權重矩陣,為利用第k個聚合器時的偏置的參數。
16、可選地,在步驟2中,通過聚合后的中心實體的鄰居信息和每個鄰居實體的自適應權重向量計算綜合特征向量,可表示為:
17、
18、式中,zagg為中心實體和鄰居實體聚合后的綜合特征向量,z(k)為第k個聚合器對中心實體聚合后中心實體的鄰居信息,αk為第k個聚合器后的鄰居實體的自適應權重向量,k為聚合器的總數;
19、對綜合特征向量和經線性變換和縮放變換的中心實體特征進行聚合,獲得更新后中心實體的特征向量h″v,可表示為:
20、h″v=σ(w3h′v+uzagg)
21、式中,w3為線性變換的權重矩陣,σ(·)為非線性激活函數,u為聚合后的鄰居信息的權重矩陣;
22、基于中心實體對更新后中心實體的特征向量進行更新,直至更新后的中心實體的特征向量不再變化,可表示為:
23、
24、式中,為第t次迭代后更新的中心實體的特征向量;當t=0時,為中心實體特征向量hv。
25、可選地,步驟3中,從同一中心實體對應的三元組中的關系提取關系信息,同時建立嵌入向量,可表示為:
26、r=r0w4
27、式中,r為關系嵌入向量,且hr∈r;r0為初始化的嵌入向量,用于關系嵌入向量r的訓練更新;w4∈rd×d為線性變換矩陣,其中,rd×d為一個d×d的實數矩陣空間;
28、將關系信息嵌入中心實體中,獲得融合實體和關系信息的嵌入向量,可表示為:
29、
30、式中,hr為關系信息,為融合實體和關系信息的嵌入向量。
31、可選地,步驟4中,將融合實體和關系信息的嵌入向量輸入編碼器中,通過線性變換獲得查詢q、鍵k、值v,可表示為:
32、q=hwq
33、k=hwk
34、v=hwv
35、式中,wq,wk和wv均為可學習的權重矩陣,h為所有融合實體和關系信息的嵌入向量組成的輸入序列。
36、可選地,步驟4中,通過多頭自注意力機制,將查詢q、鍵k、值v進行多頭分割,獲得與鄰居實體數量相同的頭部注意力機制;計算每個頭部注意力機制的得分矩陣,可表示為:
37、
38、式中,si為頭部注意力機制的得分矩陣,n為鄰居實體的數量,dk為多頭自注意力每個頭的維度,qi、ki分別為多頭分割后的查詢、鍵,kit為分割后的鍵ki的轉置;
39、將每個頭部注意力機制的得分矩陣與多頭分割后的值相乘,獲得每個頭部注意力的輸出矩陣;并將所有頭部注意力的輸出矩陣拼接在一起,得到完整的多頭自注意力輸出矩陣。
40、可選地,步驟5中,將多頭自注意力的輸出矩陣通過一個前饋神經網絡進行處理,獲得最終的編碼器輸出矩陣,可表示為:
41、e=layernorm(z+ffn(z))
42、式中,e為編碼器輸出矩陣;z為多頭自注意力的輸出矩陣,laternorm()為一個歸一化層;ffn為全連接前饋神經網絡。
43、可選地,步驟6中,將知識圖譜中的三元組分為正樣本集合和負樣本集合,所述負樣本集合可表示為:
44、
45、式中,s′為負樣本集合,e′i為負樣本集合中中心實體的嵌入向量,r為關系的嵌入向量,ej為負樣本集合中鄰居實體的嵌入向量。
46、可選地,步驟6中,利用transe方法定義損失函數,并使用adam優化器對損失函數進行優化,所述優化后的損失函數可表示為:
47、
48、式中,為優化后的損失函數,為標簽函數,s為正樣本集合,s′為負樣本集合,λ為正則化項的超參數,ti,j,k為知識圖譜中的三元組,f(ti,j,k)為計算三元本文檔來自技高網...
【技術保護點】
1.一種層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,具體步驟包括:
2.根據權利要求1所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,在步驟2中,分別對中心實體和鄰居實體進行線性變換和縮放處理,獲得中心實體、鄰居實體經線性變換和縮放處理后的特征向量,可表示為:
3.根據權利要求2所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,在步驟2中,通過聚合后的中心實體的鄰居信息和每個鄰居實體的自適應權重向量計算綜合特征向量,可表示為:
4.根據權利要求3所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟3中,從同一中心實體對應的三元組中的關系提取關系信息,同時建立嵌入向量,可表示為:
5.根據權利要求4所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟4中,將融合實體和關系信息的嵌入向量輸入編碼器中,通過線性變換獲得查詢Q、鍵K、值V,可表示為:
6.根據權利要求5所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟4中,通過多頭自注意力機制,將查詢Q、鍵K
7.根據權利要求6所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟5中,將多頭自注意力的輸出矩陣通過一個前饋神經網絡進行處理,獲得最終的編碼器輸出矩陣,可表示為:
8.根據權利要求1所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟6中,將知識圖譜中的三元組分為正樣本集合和負樣本集合,所述負樣本集合可表示為:
9.根據權利要求8所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟6中,利用TransE方法定義損失函數,并使用Adam優化器對損失函數進行優化,所述優化后的損失函數可表示為:
10.根據權利要求1所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟1中,利用中心實體、關系、鄰居實體構建同構子圖,將同一關系路徑下的鄰居實體劃分在一起。
...【技術特征摘要】
1.一種層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,具體步驟包括:
2.根據權利要求1所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,在步驟2中,分別對中心實體和鄰居實體進行線性變換和縮放處理,獲得中心實體、鄰居實體經線性變換和縮放處理后的特征向量,可表示為:
3.根據權利要求2所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,在步驟2中,通過聚合后的中心實體的鄰居信息和每個鄰居實體的自適應權重向量計算綜合特征向量,可表示為:
4.根據權利要求3所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟3中,從同一中心實體對應的三元組中的關系提取關系信息,同時建立嵌入向量,可表示為:
5.根據權利要求4所述的層次實體鄰居多關系融合的知識圖譜補全方法,其特征在于,步驟4中,將融合實體和關系信息的嵌入向量輸入編碼器中,通過線性變換獲得查詢q、鍵k、值v,可表示為:
6.根據權利要求5所述的層次實體鄰居多關系融合的知識圖譜補...
【專利技術屬性】
技術研發人員:陳赟,周敏,王佳裕,謝邦鵬,沈浩,潘智俊,趙文愷,傅超然,王曉慧,杜海舟,曹渝昆,徐康樂,
申請(專利權)人:國網上海市電力公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。