System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及圖譜構建,尤其涉及一種基于ciem和深度學習的知識圖譜構建方法及裝置。
技術介紹
1、為了預測三元組的缺失元素,基于翻譯的知識圖表示學習技術得到了廣泛應用。表示學習將實體和關系嵌入到向量空間中,產生了許多成功的翻譯模型。
2、在多任務遷移學習層中,語言模型和序列標注層擬共享同一個字符級別輸入層,這樣符合多任務學習和遷移學習框架的要求。但是語言模型和序列標注這兩個任務并不是非常關聯,為了緩解這種低關聯問題在多任務學習中帶來的負面影響,低關聯問題往往會影響多任務學習效果。
3、傳統jet(即joint?entity?and?triple?extraction)模型是一種用于細粒度情感分析的模型,它旨在從文本中提取情感三元組,即實體(entity)、屬性(aspect)和情感(opinion)。這種模型通常涉及到對文本進行深入分析,以識別出與特定實體相關的屬性,并判斷這些屬性上的情感傾向。jet模型在特征提取的完整性方面存在局限,這可能導致模型無法充分捕捉文本的所有相關信息。
4、傳統的知識圖和文本的聯合學習模型構建的知識圖譜可能不完整,存在信息缺失的問題,低質量的知識圖譜會限制模型的效果。在處理大規模的異構圖和文本數據時計算成本較高,隨著時間的推移,知識圖譜需要不斷更新以保持信息的準確性和時效性,且模型的性能在很大程度上依賴于知識圖譜的覆蓋度和準確性。模型泛化能力不足,對特定領域或任務過度擬合的泛化能力不足。
5、有鑒于此,如何提供一種知識圖譜構建技術,構建大規模知識圖譜,成
技術實現思路
1、本申請實施例提供一種基于ciem和深度學習的知識圖譜構建方法,一種基于ciem和深度學習的知識圖譜構建裝置,一種計算設備以及一種計算機存儲介質,用以解決現有技術中存在的知識圖譜覆蓋度小,準確度不高的問題。
2、第一方面,本申請實施例提供一種基于ciem和深度學習的知識圖譜構建方法,包括:
3、構建輸入序列,以利用構建的多任務遷移學習模型,識別出實體信息、屬性信息,并利用基于正則化的方法提取實體之間的關系,其中,所述多任務遷移學習模型包括字符級的雙向lstm模型、詞級別的雙向lstm模型和crf層,所述字符級的雙向lstm模型作為語言模型,所述詞級別的雙向lstm模型用于序列標注特征抽取,所述crf層用于序列解碼;
4、將識別出的實體信息、屬性信息以及實體之間的關系,利用基于交互注意力機制的知識圖譜和文本聯合表示模型,以對知識圖表示和文本關系表示進行學習訓練;
5、基于訓練后的基于交互注意力機制的知識圖譜和文本聯合表示模型完成知識圖譜構建。
6、第二方面,本申請實施例提供一種基于ciem和深度學習的知識圖譜構建裝置,包括:
7、提取模塊,被配置為構建輸入序列,以利用構建的多任務遷移學習模型,識別出實體信息、屬性信息,并利用基于正則化的方法提取實體之間的關系,其中,所述多任務遷移學習模型包括字符級的雙向lstm模型、詞級別的雙向lstm模型和crf層,所述字符級的雙向lstm模型作為語言模型,所述詞級別的雙向lstm模型用于序列標注特征抽取,所述crf層用于序列解碼;
8、訓練模塊,被配置為將識別出的實體信息、屬性信息以及實體之間的關系,利用基于交互注意力機制的知識圖譜和文本聯合表示模型,以對知識圖表示和文本關系表示進行學習訓練;
9、構建模塊,被配置為基于訓練后的基于交互注意力機制的知識圖譜和文本聯合表示模型完成知識圖譜構建。
10、第三方面,本申請實施例提供一種計算設備,包括:
11、存儲器和處理器;
12、所述存儲器用于存儲計算機可執行指令,所述處理器用于執行所述計算機可執行指令,該計算機可執行指令被處理器執行時實現上述基于ciem和深度學習的知識圖譜構建方法的步驟。
13、第四方面,本申請實施例提供一種計算機可讀存儲介質,其存儲有計算機可執行指令,該指令被處理器執行時實現上述基于ciem和深度學習的知識圖譜構建方法的步驟。
14、本申請實施例提出了一種基于ciem和深度學習的知識圖譜構建方法,包括:構建輸入序列,以利用構建的多任務遷移學習模型,識別出實體信息、屬性信息,并利用基于正則化的方法提取實體之間的關系,其中,所述多任務遷移學習模型包括字符級的雙向lstm模型、詞級別的雙向lstm模型和crf層,所述字符級的雙向lstm模型作為語言模型,所述詞級別的雙向lstm模型用于序列標注特征抽取,所述crf層用于序列解碼;將識別出的實體信息、屬性信息以及實體之間的關系,利用基于交互注意力機制的知識圖譜和文本聯合表示模型,以對知識圖表示和文本關系表示進行學習訓練;基于訓練后的基于交互注意力機制的知識圖譜和文本聯合表示模型完成知識圖譜構建。
15、應用本申請實施例提供的方法,旨在面向涵蓋場館、專業人才、群文隊伍等全領域、全類別海量異構信息,構建面向“跨系統、跨地域、跨部門、跨層級、跨業務”的“知識抽取-知識加工-知識融合-知識評估”全流程異構知識表達組織與存儲檢索方法,并基于ciem字典映射到可跨域共享的信息,通過實體對齊、消歧和校驗,構建大規模知識圖譜,從而實現知識圖譜更新信息的準確性和時效性,提升知識圖譜的覆蓋度和準確度。
16、上述說明僅是本申請技術方案的概述,為了能夠更清楚了解本申請的技術手段,而可依照說明書的內容予以實施,并且為了讓本申請的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本申請的具體實施方式。
本文檔來自技高網...【技術保護點】
1.一種基于CIEM和深度學習的知識圖譜構建方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述方法,還包括:
3.根據權利要求1所述的方法,其特征在于,所述構建輸入序列,以利用構建的多任務遷移學習模型,識別出實體信息、屬性信息,包括:
4.根據權利要求3所述的方法,其特征在于,所述對所述輸入序列中各序列成員對應的觀測值,采用字符級別的雙向LSTM模型作為語言模型,并結合詞級別的雙向LSTM模型進行處理得到的序列標注特征抽取層,生成多任務遷移學習層,還包括:
5.根據權利要求1所述的方法,其特征在于,所述利用基于正則化的方法提取實體之間的關系,包括:
6.根據權利要求1所述的方法,其特征在于,所述基于訓練后的基于交互注意力機制的知識圖譜和文本聯合表示模型完成知識圖譜構建,包括:
7.根據權利要求6所述的方法,其特征在于,所述從知識圖譜學習實體向量表示的嵌入式表示和關系向量表示,包括:
8.根據權利要求6所述的方法,其特征在于,所述從知識圖譜學習實體向量表示的嵌入式表示和關系向量
9.根據權利要求6所述的方法,其特征在于,所述整合實體向量表示的所述嵌入式表示、所述關系向量表示以及所述關系向量表示的嵌入表示,完成知識圖譜構建,包括:
10.一種基于CIEM和深度學習的知識圖譜構建裝置,其特征在于,包括:
...【技術特征摘要】
1.一種基于ciem和深度學習的知識圖譜構建方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述方法,還包括:
3.根據權利要求1所述的方法,其特征在于,所述構建輸入序列,以利用構建的多任務遷移學習模型,識別出實體信息、屬性信息,包括:
4.根據權利要求3所述的方法,其特征在于,所述對所述輸入序列中各序列成員對應的觀測值,采用字符級別的雙向lstm模型作為語言模型,并結合詞級別的雙向lstm模型進行處理得到的序列標注特征抽取層,生成多任務遷移學習層,還包括:
5.根據權利要求1所述的方法,其特征在于,所述利用基于正則化的方法提取實體之間的關系,包括:
【專利技術屬性】
技術研發人員:張雪瑩,金昊,林暉,李慧波,王迎雪,高敏,李丁園,高陽陽,
申請(專利權)人:中國電子科技集團有限公司電子科學研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。