• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于開放數據的知識圖譜動態風險識別方法及裝置制造方法及圖紙

    技術編號:39832622 閱讀:9 留言:0更新日期:2023-12-29 16:15
    本發明專利技術涉及一種基于開放數據的知識圖譜動態風險識別方法及裝置,包括獲取文本數據得到待處理數據,抽取得到多個抽取結果,合并構建第一聯通子圖;確定核心事件,向量化核心事件得到事件向量和實體向量并合并,基于合并向量從向量索引庫中檢索出超過預設第一相似度閾值的歷史事件向量;合并核心事件向量和歷史事件向量構建第二聯通子圖;從預設圖數據庫中查詢與核心事件具有關聯的實體歷史事件數據,得到完整聯通子圖;判斷完整聯通子圖中與核心事件具有共同實體的事件是否存在預警事件類型

    【技術實現步驟摘要】
    基于開放數據的知識圖譜動態風險識別方法及裝置


    [0001]本專利技術屬于知識圖譜
    ,具體涉及一種基于開放數據的知識圖譜動態風險識別方法及裝置


    技術介紹

    [0002]相關技術中,在企業聲譽風險的預警的時候,需要通過互聯網數據快速發現企業出現的風險

    動態風險識別一般是利用采集時間案例信息,對信息的事件內容數據進行提取處理,構建基礎知識庫,根據內容進行打標簽,標簽包括行業分類

    時間分類和風控屬性等,通過標簽與對應企業進行關聯,根據預先構建的知識圖譜檢索與此時間有關聯的其他信息,從而將事件與其他內容聯系起來,并獲取企業所關注的行業信息,形成關系圖譜,針對時間的輿論影響程度

    敏感要素和輿論發展階段等既定模塊的維度進行評分,根據評分與標簽構建內容風險預警規則,在系統新增或更新事件案例時,利用內容風險預警規則對客戶系統進行風險預警

    而一般基于知識圖譜的企業風險傳導分析一般是輿情爬蟲,關注標的,輿情語義分析,然后企業知識圖譜

    風險傳導計算然后風險預警推送

    [0003]綜上,傳統的做法一般需要對新聞等數據先做數據清洗和抽取,然后構建圖譜,當圖譜構建完成后,再通過事件分類

    圖譜規則或者查詢其他數據的風險信息號去判斷風險

    但其存在以下問題:時效性問題:預警需要快速高效,傳統做法處理過程長過長,首先都需要經過復雜的抽取抽取步驟,每個步驟出現問題都影響后續的處理,例如分詞

    實體識別

    在實體對齊;然后根據抽取的結果再構建圖譜或者更新圖譜,然后再進行風險的識別

    [0004]準確度低:以往方法中使用的分詞

    標簽分類

    實體識別和對齊(一般用詞典

    正則表表達式的方法)的方法本身存在準確率問題,由于是串行執行,會使誤差進行累加,最后影響圖譜的構建和預警判斷的的準確度

    [0005]依賴專家知識:現有的預警識別,大多采用內容分類標簽的方法,或者專家直接規定方法

    無論哪種方法,分類的規則或者標簽體系都是通過專家制定好的,或者其他系統(也是專家設計的)的

    所以當遇到未曾發現的事件,或者描述不清的情況,或者模型無法識別

    或者根本不在系統中,造成是識別錯誤

    [0006]構建成本:以往的圖譜或者模型的訓練樣本,都需要大量的前期標注,成本巨大


    技術實現思路

    [0007]有鑒于此,本專利技術的目的在于克服現有技術的不足,提供一種基于開放數據的知識圖譜動態風險識別方法及裝置,以解決現有技術中風險判斷方法存在時效性低

    準確度低的問題

    [0008]為實現以上目的,本專利技術采用如下技術方案:一種基于開放數據的知識圖譜動態風險識別方法,包括:獲取文本數據,并處理后得到待處理數據;
    利用大型語言模型對所述待處理數據進行數據抽取,得到多個抽取結果,對多個所述抽取結果進行合并構建第一聯通子圖;確定所述第一聯通子圖中的核心事件,向量化所述核心事件得到事件向量和實體向量并合并,得到合并向量,基于所述合并向量從預設的向量索引庫中檢索出超過預設第一相似度閾值的歷史事件向量;合并所述核心事件向量和歷史事件向量構建第二聯通子圖;從預設圖數據庫中查詢與所述核心事件具有關聯的實體歷史事件數據;利用所述實體歷史事件數據對所述第二聯通子圖進行補充,得到完整聯通子圖;基于預設的數據事件類型庫判斷所述完整聯通子圖中與核心事件具有共同實體的事件是否存在預警事件類型,并在存在時進行優先級預警

    [0009]進一步的,還包括:對歷史事件進行聚類,得到聚類簇;所述聚類簇包括實體聚類簇和無實體聚類簇;計算聚類簇的相似度,得到第二相似度閾值;從向量索引庫中檢索出與所述事件向量超過第二相似度閾值的同類事件;從圖數據庫中檢索與所述同類事件關聯的歷史關聯事件;對所述同類事件

    歷史關聯事件進行過濾,得到相關歷史事件;基于預設的數據事件類型庫判斷所述相關歷史事件是否存在預警事件類型,并在存在時進行次優先級預警

    [0010]進一步的,所述獲取文本數據,并處理后得到待處理數據,包括:獲取文字信息

    圖片信息及語音信息,通過所述文字信息

    圖片信息及語音信息提取文本數據;對所述文本數據進行清洗,并將清洗后的文本數據進行向量化處理,得到文本向量;基于預設的第三相似度閾值對所述文本向量進行去重操作,得到待處理數據

    [0011]進一步的,利用大型語言模型對所述待處理數據進行數據抽取,包括:基于關聯的實體

    時間描述和時間屬性利用大型語言模型對所述待處理數據進行數據抽取;其中,所述大型語言模型中預設事件類型;所述預設事件類型包括監管處罰

    司法訴訟

    公司倒閉

    股價暴跌

    高層離職

    客戶
    /
    合作伙伴流失

    聲譽損害

    業務收縮或轉型

    資產出售

    資金鏈斷裂

    減員或裁員

    收到政府救助以及被收購或合并

    [0012]進一步的,所述從預設圖數據庫中查詢與所述核心事件具有關聯的實體歷史事件數據,包括:利用預設的向量索引庫和實體向量查詢得到相似實體,基于所述相似實體從圖數據庫中獲取實體歷史事件數據;其中,所述向量索引庫通過對抽取去重后的實體的名稱為基礎,采用預訓練模型形成的實體向量,將所述實體向量保存至向量
    FAISS
    數據庫形成

    [0013]進一步的,利用所述實體歷史事件數據對所述第二聯通子圖進行補充,得到完整聯通子圖,包括:
    將檢索得到的事件向量

    實體向量

    實體歷史事件數據進行整合去重;通過時間屬性對去重后的數據進行事件窗口過濾,對過濾后得到的數據進行整合,得到完整聯通子圖

    [0014]進一步的,整合所述優先級預警和次優先級預警,得到最終預警

    [0015]進一步的,采用預訓練模型對所述核心事件的事件描述進行向量化,得到事件向量;采用預訓練模型對所述核心事件的實體進行名稱的向量化,并疊加得到實體向量

    [0016]進一步的,還包括:當抽取的事件

    相關實體

    關系更新時,更新第一聯通子圖;當事件向量

    實體向量更新時,更新向量索引庫;當預警事件類型更新時,更新數據事件類型庫

    [0017]本申請實施例提供一種基于開放數據的知識圖譜動態風險識別裝置,包括本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.
    一種基于開放數據的知識圖譜動態風險識別方法,其特征在于,包括:獲取文本數據,并處理后得到待處理數據;利用大型語言模型對所述待處理數據進行數據抽取,得到多個抽取結果,對多個所述抽取結果進行合并構建第一聯通子圖;確定所述第一聯通子圖中的核心事件,向量化所述核心事件得到事件向量和實體向量并合并,得到合并向量,基于所述合并向量從預設的向量索引庫中檢索出超過預設第一相似度閾值的歷史事件向量;合并所述核心事件向量和歷史事件向量構建第二聯通子圖;從預設圖數據庫中查詢與所述核心事件具有關聯的實體歷史事件數據;利用所述實體歷史事件數據對所述第二聯通子圖進行補充,得到完整聯通子圖;基于預設的數據事件類型庫判斷所述完整聯通子圖中與核心事件具有共同實體的事件是否存在預警事件類型,并在存在時進行優先級預警
    。2.
    根據權利要求1所述的方法,其特征在于,還包括:對歷史事件進行聚類,得到聚類簇;所述聚類簇包括實體聚類簇和無實體聚類簇;計算聚類簇的相似度,得到第二相似度閾值;從向量索引庫中檢索出與所述事件向量超過第二相似度閾值的同類事件;從圖數據庫中檢索與所述同類事件關聯的歷史關聯事件;對所述同類事件

    歷史關聯事件進行過濾,得到相關歷史事件;基于預設的數據事件類型庫判斷所述相關歷史事件是否存在預警事件類型,并在存在時進行次優先級預警
    。3.
    根據權利要求1或2所述的方法,其特征在于,所述獲取文本數據,并處理后得到待處理數據,包括:獲取文字信息

    圖片信息及語音信息,通過所述文字信息

    圖片信息及語音信息提取文本數據;對所述文本數據進行清洗,并將清洗后的文本數據進行向量化處理,得到文本向量;基于預設的第三相似度閾值對所述文本向量進行去重操作,得到待處理數據
    。4.
    根據權利要求3所述的方法,其特征在于,利用大型語言模型對所述待處理數據進行數據抽取,包括:基于關聯的實體

    時間描述和時間屬性利用大型語言模型對所述待處理數據進行數據抽取;其中,所述大型語言模型中預設事件類型;所述預設事件類型包括監管處罰

    司法訴訟

    公司倒閉

    股價暴跌

    高層離職

    客戶
    /
    合作伙伴流失

    聲譽損害

    業務收縮或轉型

    資產出售

    資金鏈斷裂

    減...

    【專利技術屬性】
    技術研發人員:賈承斌莫倩蔡錦森艾青靳許石雨智德
    申請(專利權)人:網智天元科技集團股份有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久久久久亚洲av成人无码国产| 国产午夜鲁丝片AV无码免费| 亚洲av永久无码精品古装片| 无码A级毛片免费视频内谢| 无码人妻一区二区三区免费手机| 国产成人无码AV片在线观看| 东京热无码一区二区三区av| 亚洲av无码不卡| 国产V片在线播放免费无码| 亚洲av日韩av无码黑人| 麻豆精品无码国产在线果冻| 亚洲VA中文字幕无码一二三区| 小12箩利洗澡无码视频网站| 亚洲AV无码国产精品麻豆天美| 色综合久久久无码中文字幕 | 国产精品成人无码久久久| 十八禁视频在线观看免费无码无遮挡骂过| 国产精品三级在线观看无码 | 国产成人无码A区在线观看导航| 日韩人妻无码精品专区| 无码中文2020字幕二区| 人妻av无码一区二区三区| 久久中文精品无码中文字幕| av色欲无码人妻中文字幕| 久久久久亚洲av无码专区导航| 日日摸夜夜爽无码毛片精选| 粉嫩大学生无套内射无码卡视频 | 无码丰满熟妇一区二区 | 亚洲人片在线观看天堂无码| 在线精品无码字幕无码AV| 国产成人无码A区在线观看视频 | 亚洲色av性色在线观无码| 国产成人综合日韩精品无码不卡| 丰满少妇人妻无码专区| 久久亚洲精品无码网站| 日韩aⅴ人妻无码一区二区| 亚洲av永久无码精品网址| 毛片免费全部播放无码| 亚洲va成无码人在线观看| 999久久久无码国产精品| 精品久久久无码人妻中文字幕|