System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及知識圖譜的構建和多元關系推理,更具體的說是涉及一種面向多元關系場景的知識推理方法、系統、裝置及介質。
技術介紹
1、知識圖譜是一種用于描述實體之間關系的語義網絡,它是一種半結構化數據的表示方法,用于描述實體、屬性和實體之間的關系。知識圖譜的核心思想是將現實世界中的信息轉化為圖形,其中節點表示實體(如人、地點、事物等),邊表示實體之間的關系。知識圖譜的目的是提高搜索引擎的性能,提供更加友好的搜索結果。隨后知識圖譜在學術界受到了極大的關注,其構建技術也在飛速發展。目前,知識圖譜已經被廣泛地應用到知識問答、智能搜索、個性化推薦、軟件復用、政府治理等多個領域。
2、目前,知識圖譜主要關注二元關系事實。二元關系事實通常表示為一個三元組<主語,謂語,賓語>組成的集合:實體、屬性、關系,抽取為<實體1,關系,實體2>和<實體1,屬性1,屬性值1>。三元組的謂語可以被理解為一個二元關系,即連接了主語和賓語的有序對組成的集合。這種簡化處理雖然在一定程度上提高了處理效率,但也導致了大量語義信息的丟失,使得實體之間存在的關系可能不完整,難以最大化發揮數據的價值。
3、在多元關系場景中,涉及兩個以上實體的關系普遍存在。例如,在開放知識圖譜freebase中,超過1/3的實體參與了多元關系事實的表示。然而,現有的研究大多集中在二元關系事實的鏈接預測上,對于多元關系事實的推理和表示學習相對較少。
技術實現思路
1、針對以上問題,本專利技
2、本專利技術為實現上述目的,通過以下技術方案實現:
3、第一方面,本專利技術公開了一種面向多元關系場景的知識推理方法,包括:
4、通過機器學習模型識別文本中的實體,并將實體鏈接到知識圖譜中的對應節點上;
5、利用語法分析器和循環神經網絡從文本中抽取實體間的關系,確定關系類型,并生成多元關系數據;
6、利用多關系超圖對多元關系數據進行建模,并使用嵌入技術將知識圖譜中的實體和實體間的關系映射到連續的向量空間以預測出未知的實體間未知的實體和實體間的關系,并更新知識圖譜;
7、利用圖結構進行邏輯推理,從知識圖譜中學習推理規則,搜索特定的路徑以發現實體間的新關系。
8、進一步,所述通過機器學習模型識別文本中的實體,并將實體鏈接到知識圖譜中的對應節點上,包括:
9、對文本進行分詞處理,對每個分詞進行特征提取,提取出文本特征;
10、使用機器學習模型對分詞進行分類,識別出文本中的實體;
11、從知識圖譜中檢索與實體名稱相匹配的候選實體,作為鏈接候選節點;
12、結合上下文信息、實體描述和知識圖譜中的關系,進行實體消歧,從候選實體出選擇出確定的實體,作為標準節點;
13、將實體鏈接到知識圖譜中的標準節點上,并確定實體的起始和結束位置。
14、進一步,所述利用語法分析器和循環神經網絡從文本中抽取實體間的關系,確定關系類型,包括:
15、使用依存句法分析解析文本的句子結構,從文本的句子中識別出實體對;
16、對每個實體對使用基于循環神經網絡rnn優化算法lstm構建的關系抽取模型來確定它們之間的關系類型。
17、進一步,所述利用多關系超圖對多元關系數據進行建模,并使用嵌入技術將知識圖譜中的實體和實體間的關系映射到連續的向量空間以預測出未知的實體間未知的實體和實體間的關系,并更新知識圖譜,包括:
18、利用多關系超圖對多元關系數據進行建模,以表示實體和關系;
19、使用嵌入技術將實體和關系映射到連續的向量空間,通過向量運算預測實體間未知的關系,使用聚類或分類方法預測新的實體類型或實例,并生成多元關系更新數據;
20、根據多元關系更新數據更新知識圖譜。
21、進一步,所述利用圖結構進行邏輯推理,從知識圖譜中學習推理規則,搜索特定的路徑以發現實體間的新關系,包括:
22、利用圖嵌入技術將知識圖譜的實體和關系轉化為向量表示,即h?+r≈t,其中h、r和t分別代表頭實體、關系和尾實體的向量表示;
23、定義評分函數為,優化目標是最小化評分函數??;
24、通過深度優先搜索算法或廣度優先搜索算法,在知識圖譜中尋找連接實體的特定路徑,以發現新的實體關系;
25、應用一階邏輯或描述邏輯推理方法,對新的實體關系進行驗證和推導,確保關系的正確性和合理性;
26、將新的實體關系以結構化的方式輸出。
27、進一步,所述文本特征包括:詞性特征、上下文特征、形態學特征;
28、所述機器學習模型包括但不限于:條件隨機場、雙向lstm模型、bert模型。
29、進一步,所述嵌入技術采用基于平移的知識圖譜嵌入模型transe、基于語義匹配的知識圖譜嵌入模型complex或基于旋轉的知識圖譜嵌入模型rotate。
30、第二方面,本專利技術還公開了一種面向多元關系場景的知識推理系統,包括:
31、實體識別與鏈接模塊,用于通過機器學習模型識別文本中的實體,并將實體鏈接到知識圖譜中的對應節點上;
32、關系抽取模塊,用于利用語法分析器和循環神經網絡從文本中抽取實體間的關系,并確定關系類型;
33、知識補全模塊,用于利用多關系超圖對多元關系數據進行建模,并使用嵌入技術將知識圖譜中的實體和實體間的關系映射到連續的向量空間以預測出未知的實體間未知的實體和實體間的關系,并更新知識圖譜;
34、圖推理模塊,用于利用圖結構進行邏輯推理,從知識圖譜中學習推理規則,搜索特定的路徑以發現實體間的新關系。
35、第三方面,本專利技術還公開了一種面向多元關系場景的知識推理裝置,包括:
36、存儲器,用于存儲面向多元關系場景的知識推理程序;
37、處理器,用于執行所述面向多元關系場景的知識推理程序時實現如上文任一項所述面向多元關系場景的知識推理方法的步驟。
38、第四方面,本專利技術還公開了一種可讀存儲介質,所述可讀存儲介質上存儲有面向多元關系場景的知識推理程序,所述面向多元關系場景的知識推理程序被處理器執行時實現如上文任一項所述面向多元關系場景的知識推理方法的步驟。
39、對比現有技術,本專利技術有益效果在于:?本專利技術公開了一種面向多元關系場景的知識推理方法、系統、裝置及介質,首先進行實體識別與鏈接,識別文本中的命名實體,并將這些實體與知識圖譜中相應的節點進行匹配鏈接。然后進行關系抽取,使用循環神經網絡rnn優化算法lstm來確定實體之間的關系類型實體間的關系以及這些關系的類型。接下來進行知識補全,利用多關系超圖對多元本文檔來自技高網...
【技術保護點】
1.一種面向多元關系場景的知識推理方法,其特征在于,包括:
2.根據權利要求1所述的面向多元關系場景的知識推理方法,其特征在于,所述通過機器學習模型識別文本中的實體,并將實體鏈接到知識圖譜中的對應節點上,包括:
3.根據權利要求2所述的面向多元關系場景的知識推理方法,其特征在于,所述利用語法分析器和循環神經網絡從文本中抽取實體間的關系,確定關系類型,包括:
4.根據權利要求3所述的面向多元關系場景的知識推理方法,其特征在于,所述利用多關系超圖對多元關系數據進行建模,并使用嵌入技術將知識圖譜中的實體和實體間的關系映射到連續的向量空間以預測出未知的實體間未知的實體和實體間的關系,并更新知識圖譜,包括:
5.根據權利要求4所述的面向多元關系場景的知識推理方法,其特征在于,所述利用圖結構進行邏輯推理,從知識圖譜中學習推理規則,搜索特定的路徑以發現實體間的新關系,包括:
6.根據權利要求2所述的面向多元關系場景的知識推理方法,其特征在于,所述文本特征包括:詞性特征、上下文特征、形態學特征;
7.根據權利要求4所述的面向
8.一種面向多元關系場景的知識推理系統,其特征在于,包括:
9.一種面向多元關系場景的知識推理裝置,其特征在于,包括:
10.一種可讀存儲介質,其特征在于:所述可讀存儲介質上存儲有面向多元關系場景的知識推理程序,所述面向多元關系場景的知識推理程序被處理器執行時實現如權利要求1至7任一項所述的面向多元關系場景的知識推理方法的步驟。
...【技術特征摘要】
1.一種面向多元關系場景的知識推理方法,其特征在于,包括:
2.根據權利要求1所述的面向多元關系場景的知識推理方法,其特征在于,所述通過機器學習模型識別文本中的實體,并將實體鏈接到知識圖譜中的對應節點上,包括:
3.根據權利要求2所述的面向多元關系場景的知識推理方法,其特征在于,所述利用語法分析器和循環神經網絡從文本中抽取實體間的關系,確定關系類型,包括:
4.根據權利要求3所述的面向多元關系場景的知識推理方法,其特征在于,所述利用多關系超圖對多元關系數據進行建模,并使用嵌入技術將知識圖譜中的實體和實體間的關系映射到連續的向量空間以預測出未知的實體間未知的實體和實體間的關系,并更新知識圖譜,包括:
5.根據權利要求4所述的面向多元關系場景的知識推理方法,其特征在于,所述利用圖結構進行邏輯推理,從知識圖譜中學習推理規...
【專利技術屬性】
技術研發人員:章敏,賈曉豐,江茜,張健楓,王宇航,
申請(專利權)人:北京市大數據中心,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。