System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于知識圖譜補全領域,尤其涉及一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法。
技術介紹
1、知識圖譜是一種結構化數據存儲形式,由實體及其之間的關系組成的有向異構圖。它通常由事實三元組構成,形式為(頭實體,關系,尾實體)。知識圖譜以其強大的語義表達能力和信息存儲功能在多個領域得到廣泛應用,包括知識發現、對話系統、語義抽取等。然而,現有知識圖譜往往存在不完整性,因此需要進行知識圖譜補全(kgc),以推斷缺失的關系或尾實體,從而改善知識圖譜的應用效果。
2、近幾年來,基于知識圖譜嵌入(kge)的方法被廣泛的應用于知識圖譜補全問題中,諸如transe,transh,transr,comple等,并取得了不錯的表現。這些基于嵌入的方法一般會將實體和關系投影到低維向量空間,隨后計算實體之間的位置關系來完成知識圖譜補全。大多數基于嵌入的知識圖譜補全系統通常需要大量的訓練三元組用于學習特定關系的表示。然而,在真實的知識圖譜中,關系往往呈現長尾分布,同一關系的關系三元組數量非常有限,例如,在nell和wikidate數據集中,超過20%的關系擁的支持三元組少于10個,傳統的知識圖譜補全方法在解決這些問題時受到極大限制。因此,少樣本知識圖譜補全模型應運而生,旨在解決傳統知識圖譜補全方法在面對支持集數據稀缺情況下的表現不佳的問題。
3、小樣本知識圖譜補全任務的一般目標是在給定關系r的k個支持實體對中學習關系r的表示,并在查詢三元組(h,r,?)中預測尾實體t。一些方法基于kge思想,通過為每個鄰居節點分配固定權
4、盡管上述模型在小樣本知識圖譜補全問題上取得了一些進展,然而這些模型仍存在一些局限性:(1)在為實體構建子圖嵌入的過程中,他們一般使用單一的方式為實體建模,沒有考慮到在不同的任務中,實體的鄰域關系應該反映出不同層面的信息。(2)沒有充分利用背景知識圖譜中的關系。小樣本補全關系的一大難點就是支持集數量太少,生成的查詢關系沒有充足的信息支持,小樣本補全的準確性不高。雖然背景知識圖譜中不存在與任務關系一樣的關系,但是相近關系的三元組在一定程度上為小樣本補全任務帶來補充。
技術實現思路
1、針對上述現有技術的不足,本專利技術提出了一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,通過為實體構建反映整體嵌入信息的關系層級嵌入和反映任務信息的頭尾實體語義嵌入等兩種不同角度的嵌入,隨后還利用背景知識圖譜中的相似關系中的三元組對任務的支持集進行數據增強,從而提升模型的整體性能。
2、為實現上述目的,本申請提出了一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,包括:
3、步驟一、設計雙側融合表示的三元組編碼器用于實體表示生成
4、采用雙側融合表示的三元組編碼器架構進行實體表示生成,雙側融合表示的三元組編碼器架構由兩部分份組成:注意力實體原型建模器、任務側實體建模器。所以實體表示分為兩部分,注意力實體原型和任務側實體建模。注意力實體原型通過多跳鄰域建模來捕獲實體的全局信息。使用關系層級的圖神經網,將實體及其鄰域的關系信息進行多層次的聚合,生成能夠反映實體全局特征的嵌入表示。任務側實體建模關注實體在具體任務中的表現。通過線性變換和雙線性點積,獲取頭尾實體在特定任務關系下的語義信息,生成與任務相關的嵌入表示。
5、步驟二、支持集增強
6、通過從背景知識圖譜中抽取與任務關系相似的關系三元組,擴充支持集的數量和質量。使用余弦相似度計算任務關系與背景關系的相似度,并通過門控機制控制增強三元組的質量,確保它們對任務關系的表示有積極貢獻。
7、步驟三、設計關系編碼器
8、關系編碼器使用雙向lstm(bi-lstm)來生成關系嵌入,考慮不同三元組之間的長距離依賴關系。結合增強三元組,通過自適應聚合隱藏狀態,生成最終的關系表示。
9、步驟四、設計manifolde解碼器
10、manifolde解碼器在三維流形球體中進行運算,將二維向量拓展到三維空間,以適應小樣本情況下的復雜關系。通過頭實體和關系嵌入,為候選尾實體打分,找到對應的尾實體,填補查詢集中的空缺三元組。
11、步驟五、模型優化
12、通過組成負三元組對步驟一至步驟三的模型進行優化,并使用優化后的模型進行小樣本知識圖譜補全。
13、本專利技術的有益效果:在nell-one和fb15k-237兩個數據集上對本專利技術提出的方法就行實驗,在k-shot的小樣本補全場景下,本方法對比現有最先進的基線方法均有顯著提升,尤其是在k值較低的情況下,本方法的各項指標下降并不明顯。由于使用了多種嵌入聚合方式,本方法制造的實體嵌入更加豐富,同時使用了背景知識圖譜中的相似實體作為關系表示的補強,相對于普通方法關系表示更為準確。manifolde方法的引入使得關系解碼器對尾實體的運算更加寬容。
本文檔來自技高網...【技術保護點】
1.一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟如下:
2.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟一具體包括:
3.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟二具體包括:
4.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟三具體包括:
5.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟四具體包括:
6.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟五具體包括:對于從訓練任務集合Rtrain中選擇的關系r,從中隨機抽取K個三元組作為該關系的支持集合Sr,并隨機抽取一些實體對組成查詢集Qr;與此同時,模型為查詢集中的每個三元組創建一些由隨機尾實體組成的負三元組;這些錯誤匹配的負三元組組成了負查詢集-Qr;小樣本補全任務是使用解碼器對這些三元組進行評分,并確保查詢集Qr中的正查詢獲得的
...【技術特征摘要】
1.一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟如下:
2.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟一具體包括:
3.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟二具體包括:
4.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征在于,步驟三具體包括:
5.根據權利要求1所述的一種基于嵌入融合和數據增強的小樣本知識圖譜補全方法,其特征...
【專利技術屬性】
技術研發人員:馬瑞新,周健,蘇克治,李世瑾,符林,郭家旗,
申請(專利權)人:大連理工大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。