【技術實現步驟摘要】
基于開放數據的知識圖譜動態風險識別方法及裝置
[0001]本專利技術屬于知識圖譜
,具體涉及一種基于開放數據的知識圖譜動態風險識別方法及裝置
。
技術介紹
[0002]相關技術中,在企業聲譽風險的預警的時候,需要通過互聯網數據快速發現企業出現的風險
。
動態風險識別一般是利用采集時間案例信息,對信息的事件內容數據進行提取處理,構建基礎知識庫,根據內容進行打標簽,標簽包括行業分類
、
時間分類和風控屬性等,通過標簽與對應企業進行關聯,根據預先構建的知識圖譜檢索與此時間有關聯的其他信息,從而將事件與其他內容聯系起來,并獲取企業所關注的行業信息,形成關系圖譜,針對時間的輿論影響程度
、
敏感要素和輿論發展階段等既定模塊的維度進行評分,根據評分與標簽構建內容風險預警規則,在系統新增或更新事件案例時,利用內容風險預警規則對客戶系統進行風險預警
。
而一般基于知識圖譜的企業風險傳導分析一般是輿情爬蟲,關注標的,輿情語義分析,然后企業知識圖譜
、
風險傳導計算然后風險預警推送
。
[0003]綜上,傳統的做法一般需要對新聞等數據先做數據清洗和抽取,然后構建圖譜,當圖譜構建完成后,再通過事件分類
、
圖譜規則或者查詢其他數據的風險信息號去判斷風險
。
但其存在以下問題:時效性問題:預警需要快速高效,傳統做法處理過程長過長,首先都需要經過復雜的抽取抽取步驟,每個步驟出現問題都影響后續的處理,例如 ...
【技術保護點】
【技術特征摘要】
1.
一種基于開放數據的知識圖譜動態風險識別方法,其特征在于,包括:獲取文本數據,并處理后得到待處理數據;利用大型語言模型對所述待處理數據進行數據抽取,得到多個抽取結果,對多個所述抽取結果進行合并構建第一聯通子圖;確定所述第一聯通子圖中的核心事件,向量化所述核心事件得到事件向量和實體向量并合并,得到合并向量,基于所述合并向量從預設的向量索引庫中檢索出超過預設第一相似度閾值的歷史事件向量;合并所述核心事件向量和歷史事件向量構建第二聯通子圖;從預設圖數據庫中查詢與所述核心事件具有關聯的實體歷史事件數據;利用所述實體歷史事件數據對所述第二聯通子圖進行補充,得到完整聯通子圖;基于預設的數據事件類型庫判斷所述完整聯通子圖中與核心事件具有共同實體的事件是否存在預警事件類型,并在存在時進行優先級預警
。2.
根據權利要求1所述的方法,其特征在于,還包括:對歷史事件進行聚類,得到聚類簇;所述聚類簇包括實體聚類簇和無實體聚類簇;計算聚類簇的相似度,得到第二相似度閾值;從向量索引庫中檢索出與所述事件向量超過第二相似度閾值的同類事件;從圖數據庫中檢索與所述同類事件關聯的歷史關聯事件;對所述同類事件
、
歷史關聯事件進行過濾,得到相關歷史事件;基于預設的數據事件類型庫判斷所述相關歷史事件是否存在預警事件類型,并在存在時進行次優先級預警
。3.
根據權利要求1或2所述的方法,其特征在于,所述獲取文本數據,并處理后得到待處理數據,包括:獲取文字信息
、
圖片信息及語音信息,通過所述文字信息
、
圖片信息及語音信息提取文本數據;對所述文本數據進行清洗,并將清洗后的文本數據進行向量化處理,得到文本向量;基于預設的第三相似度閾值對所述文本向量進行去重操作,得到待處理數據
。4.
根據權利要求3所述的方法,其特征在于,利用大型語言模型對所述待處理數據進行數據抽取,包括:基于關聯的實體
、
時間描述和時間屬性利用大型語言模型對所述待處理數據進行數據抽取;其中,所述大型語言模型中預設事件類型;所述預設事件類型包括監管處罰
、
司法訴訟
、
公司倒閉
、
股價暴跌
、
高層離職
、
客戶
/
合作伙伴流失
、
聲譽損害
、
業務收縮或轉型
、
資產出售
、
資金鏈斷裂
、
減...
【專利技術屬性】
技術研發人員:賈承斌,莫倩,蔡錦森,艾青,靳許,石雨,智德,
申請(專利權)人:網智天元科技集團股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。