"/>
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    實體關系抽取方法技術

    技術編號:39659250 閱讀:23 留言:0更新日期:2023-12-09 11:28
    本申請涉及一種實體關系抽取方法

    【技術實現步驟摘要】
    實體關系抽取方法、裝置、終端及存儲介質


    [0001]本申請涉及自然語言處理領域,尤其是涉及一種利用全局指針網絡增強的實體關系抽取方法

    裝置

    終端及存儲介質


    技術介紹

    [0002]在自然語言處理
    (Natural Language Processing,NLP)
    領域中,實體關系抽取是一項關鍵任務,旨在從非結構化文本中抽取出具有特定語義關系的實體對

    實體關系抽取在許多場景中都具有重要的應用價值,如信息提取

    問題回答

    知識圖譜構建等

    [0003]以往的實體關系抽取方案通常只關注于頭實體

    尾實體和實體關系這三個要素,抽取結果的表現形式也多為一個關系三元組
    (
    頭實體

    關系

    尾實體
    )
    ,就抽取結果本身而言,其完全忽略了實體的類型信息

    但是在后續的應用場景中,實體的類型信息可以在理解實體關系時發揮巨大的作用,因此上述傳統的實體關系抽取方案在結果的完整性方面都有待提高

    [0004]因此,如何提出一種全新的實體關系抽取方案,在實體關系抽取的過程中實現對實體類型的細致處理,提高實體關系抽取的準確性和可解釋性,也就成為了本領域內技術人員亟待解決的問題


    技術實現思路

    [0005]為了改進現有的實體關系抽取方案,本申請提供了一種實體關系抽取方法

    裝置

    終端及存儲介質

    本申請的方案充分利用了全局指針網絡,實現了實體關系抽取過程中對于實體類型的細致處理,提高了實體關系抽取的準確性和可解釋性

    [0006]第一方面,本申請提供了一種實體關系抽取方法,采用如下所述的技術方案

    [0007]一種實體關系抽取方法,包括如下步驟:
    [0008]對所獲取的文本信息進行序列化處理

    得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中

    得到文本編碼結果;
    [0009]依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測

    得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測

    得到尾實體的首尾位置及對應的尾實體類型;
    [0010]對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系;
    [0011]對所述頭實體的首尾位置

    所述頭實體類型

    所述頭尾實體之間的關系

    所述尾實體的首尾位置

    所述尾實體類型進行信息匯總

    形成實體關系抽取結果并將其作為針對所述文本信息的輸出

    [0012]通過采用上述技術方案,利用全局指針網絡的技術架構,有效地捕獲并利用頭

    尾實體類型去增強實體關系抽取過程中地全局信息

    相較于現有方案中局部上下文的實體關系抽取,全局指針網絡能夠更準確地識別頭實體

    尾實體,并在全局范圍內完成實體對齊,
    最大限度地保證了實體關系抽取結果的精度

    [0013]此外,上述技術方案與現有的標注工具具有較高的適配性,所輸出的實體關系抽取結果可以直接導入至標注工具中,為專業人士后續的審核和修訂提供了便利,進一步提高了實體關系抽取的效率和可用性

    [0014]優選地,所述對所獲取的文本信息進行序列化處理

    得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中

    得到文本編碼結果,具體包括如下步驟:
    [0015]獲取文本信息,對所述文本信息進行序列化處理并在文本的首尾分別添加相對應的標記

    得到文本序列;
    [0016]將所述文本序列輸入經過預訓練的編碼模型中

    將所述編碼模型的輸出作為文本編碼結果,所述標記與所述編碼模型相適配,所述編碼模型為
    BERT
    ?
    Encoder
    模型

    [0017]通過采用上述技術方案,進一步明確了方法中文本編碼結果的生成過程,為方法后續的各項處理提供了基礎的技術支持

    [0018]優選地,所述依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測

    得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測

    得到尾實體的首尾位置及對應的尾實體類型,具體包括如下步驟:
    [0019]依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,所述頭實體跨度中包含有頭實體的開始索引及結束索引,所述尾實體跨度中包含有尾實體的開始索引及結束索引;
    [0020]依據所述頭實體的開始索引及結束索引,分別得到頭實體的開始位置與頭實體的結束位置,依據所述頭實體的開始位置及所述頭實體的結束位置,計算得到所述頭實體作為特定頭實體類型的得分并據此確定所述頭實體對應的頭實體類型;
    [0021]依據所述尾實體的開始索引及結束索引,分別得到尾實體的開始位置與頭實體的結束位置,依據所述尾實體的開始位置及所述尾實體的結束位置,計算得到所述尾實體作為特定尾實體類型的得分并據此確定所述尾實體對應的尾實體類型

    [0022]通過采用上述技術方案,實現了在頭實體

    尾實體抽取過程中對于實體類型信息的兼顧,其中的頭實體預測及尾實體預測過程可以針對特定的實體類型進行精確識別,增強了方法整體對于實體的判別能力,降低了誤抽取的風險

    [0023]優選地,所述對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系,具體包括如下步驟:
    [0024]依據所述頭實體的開始位置及所述尾實體的開始位置,計算得到特定關系下所述頭實體與所述尾實體二者開始索引的匹配得分并將其作為第一對齊匹配結果;
    [0025]依據所述頭實體的結束位置及所述尾實體的結束位置,計算得到特定關系下所述頭實體與所述尾實體二者結束索引的匹配得分并將其作為第二對齊匹配結果;
    [0026]綜合所述第一對齊匹配結果及所述第二對齊匹配結果,完成所述頭實體與所述尾實體之間的關系對齊,確定與所述頭實體及所述尾實體相對應的所述頭尾實體之間的關系

    [0027]通過采用上述技術方案,快速且準確的獲知了頭實體與尾實體之間的關聯并預測了二者間的關系,其中對于頭實體與尾實體二者語義關聯的考慮,使得基于本方法的裝置
    或模本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.
    一種實體關系抽取方法,其特征在于,包括如下步驟:對所獲取的文本信息進行序列化處理

    得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中

    得到文本編碼結果;依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測

    得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測

    得到尾實體的首尾位置及對應的尾實體類型;對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系;對所述頭實體的首尾位置

    所述頭實體類型

    所述頭尾實體之間的關系

    所述尾實體的首尾位置

    所述尾實體類型進行信息匯總

    形成實體關系抽取結果并將其作為針對所述文本信息的輸出
    。2.
    根據權利要求1所述的實體關系抽取方法,其特征在于,所述對所獲取的文本信息進行序列化處理

    得到文本序列,將所述文本序列輸入經過預訓練的編碼模型中

    得到文本編碼結果,具體包括如下步驟:獲取文本信息,對所述文本信息進行序列化處理并在文本的首尾分別添加相對應的標記

    得到文本序列;將所述文本序列輸入經過預訓練的編碼模型中

    將所述編碼模型的輸出作為文本編碼結果,所述標記與所述編碼模型相適配,所述編碼模型為
    BERT
    ?
    Encoder
    模型
    。3.
    根據權利要求2所述的實體關系抽取方法,其特征在于,所述依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,依據所述頭實體跨度進行頭實體預測

    得到頭實體的首尾位置及對應的頭實體類型,依據所述尾實體跨度進行尾實體預測

    得到尾實體的首尾位置及對應的尾實體類型,具體包括如下步驟:依據所述文本編碼結果分別計算得到所述文本序列中的頭實體跨度及尾實體跨度,所述頭實體跨度中包含有頭實體的開始索引及結束索引,所述尾實體跨度中包含有尾實體的開始索引及結束索引;依據所述頭實體的開始索引及結束索引,分別得到頭實體的開始位置與頭實體的結束位置,依據所述頭實體的開始位置及所述頭實體的結束位置,計算得到所述頭實體作為特定頭實體類型的得分并據此確定所述頭實體對應的頭實體類型;依據所述尾實體的開始索引及結束索引,分別得到尾實體的開始位置與頭實體的結束位置,依據所述尾實體的開始位置及所述尾實體的結束位置,計算得到所述尾實體作為特定尾實體類型的得分并據此確定所述尾實體對應的尾實體類型
    。4.
    根據權利要求3所述的實體關系抽取方法,其特征在于,所述對所述頭實體的首尾位置及所述尾實體的首尾位置進行對齊匹配,依據對齊匹配結果確定頭尾實體之間的關系,具體包括如下步驟:依據所述頭實體的開始位置及所述尾實體的開始位置,計算得到特定關系下所述頭實體與所述尾實體二者開始索引的匹配得分并將其作為第一對齊匹配結果;依據所述頭實體的結束位置及所述尾實體的結束位置,計算得到特定關系下所述頭實體與所述尾實體二者結束索引的匹配得分并將其作為第二對齊匹配結果;綜合所述第一對齊匹配結果及所述第二對齊匹配結果,完成所述頭...

    【專利技術屬性】
    技術研發人員:龍如山劉志遠吳俁馬學中胡德斌
    申請(專利權)人:蘇州維眾數據技術有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲av纯肉无码精品动漫| 无码精品国产一区二区三区免费| 日韩成人无码一区二区三区| 亚洲av无码专区在线观看素人| 亚洲AV无码不卡在线播放| 亚洲精品无码av片| 久久久无码精品国产一区 | 无码av免费一区二区三区| 永久免费av无码不卡在线观看| 在线精品自拍无码| MM1313亚洲精品无码久久| 亚洲国产成人精品无码区在线观看 | 性无码一区二区三区在线观看| 日本无码一区二区三区白峰美| 中文字字幕在线中文无码| 无码 免费 国产在线观看91| 亚洲av中文无码乱人伦在线观看| 无码国产精品一区二区免费3p| 国产免费久久久久久无码| 高清无码一区二区在线观看吞精| 一本久道综合在线无码人妻| 精品三级AV无码一区| 无码国产福利av私拍| 久久久久久久无码高潮| 亚洲AV无码不卡无码| 亚洲色无码一区二区三区| 亚洲精品中文字幕无码蜜桃| 国产精品无码免费专区午夜| 亚洲AV无码之日韩精品| 成人无码A区在线观看视频| 久久国产三级无码一区二区| 狠狠躁天天躁无码中文字幕图| 无翼乌工口肉肉无遮挡无码18| 国产av无码久久精品| 成人无码嫩草影院| 国产麻豆天美果冻无码视频| 中文字幕无码久久精品青草| 国产在线无码不卡影视影院 | 人妻无码久久精品| 国产精品xxxx国产喷水亚洲国产精品无码久久一区 | 亚洲精品无码日韩国产不卡av|