"/>
【技術實現步驟摘要】
實體關系抽取方法、裝置、終端及存儲介質
[0001]本申請涉及自然語言處理領域,尤其是涉及一種利用全局指針網絡增強的實體關系抽取方法
、
裝置
、
終端及存儲介質
。
技術介紹
[0002]在自然語言處理
(Natural Language Processing,NLP)
領域中,實體關系抽取是一項關鍵任務,旨在從非結構化文本中抽取出具有特定語義關系的實體對
。
實體關系抽取在許多場景中都具有重要的應用價值,如信息提取
、
問題回答
、
知識圖譜構建等
。
[0003]以往的實體關系抽取方案通常只關注于頭實體
、
尾實體和實體關系這三個要素,抽取結果的表現形式也多為一個關系三元組
(
頭實體
、
關系
、
尾實體
)
,就抽取結果本身而言,其完全忽略了實體的類型信息
。
但是在后續的應用場景中,實體的類型信息可以在理解實體關系時發揮巨大的作用,因此上述傳統的實體關系抽取方案在結果的完整性方面都有待提高
。
[0004]因此,如何提出一種全新的實體關系抽取方案,在實體關系抽取的過程中實現對實體類型的細致處理,提高實體關系抽取的準確性和可解釋性,也就成為了本領域內技術人員亟待解決的問題
。
技術實現思路
[0005]為了改進現有的實體關系抽取方案,本申請提供了一種實體關 ...
【技術保護點】
【技術特征摘要】
1.
一種實體關系抽取方法,其特征在于,包括如下步驟:對所獲取的文本信息進行序列化處理
、
得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中
、
得到文本編碼結果;依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測
、
得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測
、
得到尾實體的首尾位置及對應的尾實體類型;對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系;對所述頭實體的首尾位置
、
所述頭實體類型
、
所述頭尾實體之間的關系
、
所述尾實體的首尾位置
、
所述尾實體類型進行信息匯總
、
形成實體關系抽取結果并將其作為針對所述文本信息的輸出
。2.
根據權利要求1所述的實體關系抽取方法,其特征在于,所述對所獲取的文本信息進行序列化處理
、
得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中
、
得到文本編碼結果,具體包括如下步驟:獲取文本信息,對所述文本信息進行序列化處理并在文本的首尾分別添加相對應的標記
、
得到文本序列;將所述文本序列輸入經過預訓練的編碼模型中
、
將所述編碼模型的輸出作為文本編碼結果,所述標記與所述編碼模型相適配,所述編碼模型為
BERT
?
Encoder
模型
。3.
根據權利要求2所述的實體關系抽取方法,其特征在于,所述依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測
、
得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測
、
得到尾實體的首尾位置及對應的尾實體類型,具體包括如下步驟:依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,所述頭實體跨度中包含有頭實體的開始索引及結束索引,所述尾實體跨度中包含有尾實體的開始索引及結束索引;依據所述頭實體的開始索引及結束索引,分別得到頭實體的開始位置與頭實體的結束位置,依據所述頭實體的開始位置及所述頭實體的結束位置,計算得到所述頭實體作為特定頭實體類型的得分并據此確定所述頭實體對應的頭實體類型;依據所述尾實體的開始索引及結束索引,分別得到尾實體的開始位置與頭實體的結束位置,依據所述尾實體的開始位置及所述尾實體的結束位置,計算得到所述尾實體作為特定尾實體類型的得分并據此確定所述尾實體對應的尾實體類型
。4.
根據權利要求3所述的實體關系抽取方法,其特征在于,所述對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系,具體包括如下步驟:依據所述頭實體的開始位置及所述尾實體的開始位置,計算得到特定關系下所述頭實體與所述尾實體二者開始索引的匹配得分并將其作為第一對齊匹配結果;依據所述頭實體的結束位置及所述尾實體的結束位置,計算得到特定關系下所述頭實體與所述尾實體二者結束索引的匹配得分并將其作為第二對齊匹配結果;綜合所述第一對齊匹配結果及所述第二對齊匹配結果,完成所述頭...
【專利技術屬性】
技術研發人員:龍如山,劉志遠,吳俁,馬學中,胡德斌,
申請(專利權)人:蘇州維眾數據技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。