本發明專利技術涉及人工智能技術領域,具體公開了一種基于領域知識圖譜的用戶行為分析裝置、方法及設備,包括知識圖譜構建單元,基于用戶多設備多賬戶異構結構化數據與非結構化數據進行融合分析,構建知識圖譜;行為模式庫構建單元,通過分析海量歷史案件數據,挖掘涉案人員數據中共同的行為模式構建行為模式庫;用戶異常分析單元,應用用戶數據和行為模式庫數據,通過行為規律和行為內容分析,提取多模態特征,訓練深度神經網絡模型,分析用戶指定時間段行為異常概率。本發明專利技術構建的領域知識圖譜,提升了數據的協同效率;結合用戶數據和歷史案件數據,自動化提取多模態特征綜合分析,結果更準確且具有說服力,可提高工作人員的工作效率。率。率。
【技術實現步驟摘要】
一種基于領域知識圖譜的用戶行為分析裝置、方法及設備
[0001]本專利技術涉及人工智能
,具體是一種基于領域知識圖譜的用戶行為分析裝置、方法及設備。
技術介紹
[0002]21世紀是互聯網和通信技術大發展的時代,電信通訊、網絡通訊、搜索瀏覽、購物消費、資金往來、娛樂視聽、出行住宿等領域都極大拓展了互聯網的邊界和應用范圍,各種數據正在迅速膨脹并變大。在此背景下,包括智能手機、智能手表、平板電腦在內的各類智能終端設備已滲透到人們生活的每個縫隙和角落,支撐著人們生活中各種有意識或無意識的重復且瑣碎的活動。
[0003]近年來,以智能手機為代表的電子設備已經成為現代人生活和工作的必備工具,而各類違法犯罪活動也在電子設備中留下了大量的過程數據。在公共安全領域,基于電子物證數據的各種用戶行為分析,尤其是用戶行為異常分析可以為案件的推進提供重要線索,然而相關數據紛繁復雜,傳統人工分析方法耗費大量人工勞動,分析的效率十分低下。
[0004]知識圖譜作為一種刻畫大規模數據關聯的利器,在人的關系與行為分析中應用價值極大。同時,在電子物證領域中,海量歷史案件數據的挖掘可以為用戶行為異常的判別提供重要思路。開發一種綜合電子數據和海量歷史案件數據,應用人工智能算法和知識圖譜技術,快速自動分析發現用戶行為異常的方法和裝置??梢詷O大的提升電子數據的協同利用效率,提高分析的準確率,進而提高相關工作人員的工作效率。
技術實現思路
[0005]本專利技術的目的在于提供一種基于領域知識圖譜的用戶行為分析裝置、方法及設備,以解決上述
技術介紹
中提出的問題。
[0006]為實現上述目的,本專利技術提供如下技術方案:
[0007]一種基于領域知識圖譜的用戶行為分析裝置,所述裝置包括:
[0008]知識圖譜構建單元,用于基于用戶多設備多賬戶異構結構化數據與非結構化數據進行融合分析,識別出人與賬戶的關系以及人與人的關系信息,構建知識圖譜;其中,識別人與人的關系信息的步驟包括基于會話上下文信息進行人員關系識別和基于信息流通模式進行人員關系識別;所述知識圖譜包括社交關系知識圖譜和應用程序使用行為知識圖譜;
[0009]行為模式庫構建單元,用于通過機器學習算法和數據挖掘算法分析歷史案件數據,挖掘涉案人員數據中共同的行為模式,將所述行為模式向審核端發送,接收審核端反饋的行為模式庫;
[0010]行為異常分析單元,用于基于所述行為模式庫,從行為規律和行為內容兩層面提取知識圖譜中的多模態特征,訓練人工智能算法,分析用戶行為異常概率;
[0011]可視化單元,用于顯示基于用戶全部數據和部分數據分別構建的知識圖譜以及用
戶行為異常分析單元相關特征及結果;
[0012]存儲單元,用于存儲用戶應用程序使用行為知識圖譜和用戶社交關系知識圖譜、行為模式庫和用戶行為異常分析特征及結果。
[0013]1、知識圖譜構建單元:
[0014]本單元中,所述多個終端設備,具體包含手機、智能手表、平板電腦、計算機等所有電子設備?;诙嘟K端行為數據,根據行為內容和字段含義,按照統一規則進行字段映射,將不同來源的數據統一成結構化數據。統一字段主要包括,設備ID、行為大類、行為細類、應用名稱、行為開始時間、行為持續時間、用戶ID、聯系人賬號ID、聯系人ID、行為內容、消息類型、行為地理位置、信息是否被刪除。
[0015]標記所述結構化數據中用戶ID、行為大類、應用名稱和聯系人ID四個字段為節點,抽取節點中的實體。所述行為大類具體包括:電信通訊、網絡通訊、資金往來、購物消費、搜索瀏覽、娛樂視聽、出行住宿和其他行為8類。
[0016]用于構建應用程序使用行為知識圖譜的關系抽取,指從數據中抽取(用戶,行為類型,應用程序)三元組關系;實體屬性抽取,其中應用程序各實體屬性為:行為開始時間,行為持續時間,聯系人賬號ID,行為內容,消息類型,行為地理位置,信息是否被刪除。
[0017]基于會話上下文信息進行人員關系識別與信息流通模式進行人員關系識別,其中基于會話上下文信息進行人員關系識別是指,采用自然語言處理技術根據會話上下文分析多人之間的身份信息;其中基于信息流通模式進行人員關系識別是指通過多人間信息傳遞模式識別多人間的上下位關系。通過將兩種人員關系識別方法進行融合使得分析結果更加準確。
[0018]用于構建社交關系知識圖譜的關系抽取,指從數據中抽取(用戶,聯系人)二元組關系;實體屬性抽取,其中聯系人各實體屬性為:行為開始時間,行為持續時間,聯系人賬號ID,行為內容,消息類型,行為地理位置,信息是否被刪除。
[0019]應用自然語言處理中的語義分析方法,分析聯系人的賬號屬性和交互行為內容,發現識別出同一好友在不同應用中的相應賬號,實現實體消岐;將應用程序字段中如 ()等符號即解釋內容去除,如將“微信(官方版)”轉換為“微信”,實現實體名稱規范化。進而構建用戶應用程序使用行為知識圖譜和用戶社交關系知識圖譜。
[0020]2、行為模式庫構建:
[0021]通過機器學習、數據挖掘算法、專家總結等方法分析海量歷史案件數據,構建行為模式庫,行為模式庫包括案件相關人員案前策劃準備、案中實施手法、案后隱匿方式等多階段行為模式。具體的:
[0022]通過分析大量真實歷史案件數據,抽取案件特征如案件類型、案件嚴重程度等信息,涉案人員屬性如性別、文化程度、初犯/再犯等信息,涉案人員數據行為模式如案前、案中、案后各階段共同的行為模式構建行為模式庫。
[0023]3、用戶行為異常分析單元:
[0024]本單元中包含一種基于人工智能的用戶行為異常分析方法,通過分析用戶應用程序使用行為知識圖譜、用戶社交關系知識圖譜、歷史行為模式庫,從行為規律和行為內容兩個層面提取多模態特征并訓練深度神經網絡模型,分析用戶行為異常概率。具體行為規律和行為內容的特征內容如下:
[0025]1)行為規律:
[0026]應用機器學習算法,判定用戶指定日期應用程序使用行為模式與歷史每天應用程序使用行為模式相比是否異常;確定與用戶聯系最密切的20位好友,應用機器學習算法,判定用戶指定分析時間段與其好友的關系與歷史相比是否存在異常;通過對比分析,確定該用戶指定時間段行為模式與行為模式庫中相似案件行為模式的重合比例。綜合上述三部分分析結果,為學習到的用戶行為規律的特征向量。
[0027]2)行為內容:
[0028]應用深度學習算法,獲取用戶指定時間段主動行為數據中的文本數據和語音數據,分析數據的情感狀態分布情況,獲得情感特征向量。
[0029]4、可視化單元,包含:
[0030]1)應用用戶全部數據構建的完整的知識圖譜和應用指定時間段行為數據構建的知識圖譜,可直觀展示用戶整體的行為規律和指定時間段行為規律是否存在差異;
[0031]2)用戶行為異常分析中提取的多模態特征,包含行為規律特征,及行為內容分析所得的情感特征向量。
[0032]3)用戶行為異常分析結果,包含本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種基于領域知識圖譜的用戶行為分析裝置,其特征在于,所述裝置包括:知識圖譜構建單元,用于基于用戶多設備多賬戶異構結構化數據與非結構化數據進行融合分析,識別出人與賬戶的關系以及人與人的關系信息,構建知識圖譜;其中,識別人與人的關系信息的步驟包括基于會話上下文信息進行人員關系識別和基于信息流通模式進行人員關系識別;所述知識圖譜包括社交關系知識圖譜和應用程序使用行為知識圖譜;行為模式庫構建單元,用于通過機器學習算法和數據挖掘算法分析歷史案件數據,挖掘涉案人員數據中共同的行為模式,將所述行為模式向審核端發送,接收審核端反饋的行為模式庫;行為異常分析單元,用于基于所述行為模式庫,從行為規律和行為內容兩層面提取知識圖譜中的多模態特征,訓練人工智能算法,分析用戶行為異常概率;可視化單元,用于顯示基于用戶全部數據和部分數據分別構建的知識圖譜以及用戶行為異常分析單元相關特征及結果;存儲單元,用于存儲用戶應用程序使用行為知識圖譜和用戶社交關系知識圖譜、行為模式庫和用戶行為異常分析特征及結果。2.根據權利要求1所述的基于領域知識圖譜的用戶行為分析裝置,其特征在于,所述基于會話上下文信息進行人員關系識別的步驟包括采用自然語言處理技術根據會話上下文分析多人之間的身份信息;所述基于信息流通模式進行人員關系識別的步驟包括通過多人間信息傳遞模式識別多人間的上下位關系。3.根據權利要求1所述的基于領域知識圖譜的用戶行為分析裝置,其特征在于,所述知識圖譜構建單元中基于用戶多設備多賬戶異構結構化數據與非結構化數據進行融合分析,識別出人與賬戶的關系以及人與人的關系信息,構建知識圖譜的步驟包括:應用自然語言處理中的語義分析方法,分析聯系人的賬號屬性和交互行為內容,識別出同一好友在不同應用中的相應賬號;識別應用程序字段中的解釋符號,基于所述解釋符號剔除解釋性內容;構建用戶應用程序使用行為知識圖譜和用戶社交關系知識圖譜。4.根據權利要求1所述的基于領域知識圖譜的用戶行為分析裝置,其特征在于,所述行為模式庫構建單元中通過機器學習算法和數據挖掘算法分析歷史案件數據,挖掘涉案人員數據中共同的行為模式,將所述行為模式向審核端發送,接收審核端反饋的行為模式庫的步驟包括:基于關聯規則算法、相似度計算算法和聚類算法分析歷史案件特征;其中,所述案件類型、案件級別和涉案人員屬性;所述涉案人員屬性包括性別、文化程度、初犯/再犯;挖掘不同案件特征和涉案人員屬性下各涉案人員多設備行為數據中案前、案中及案后各階段共同的行為模式;將所述行為模式向審核端發送,接收審核端反饋的行為模式庫。5.根據權利要求1所述的基于領域知識圖譜的用戶行為分析裝置,其特征在于,所述行為異常分析單元中基于所述行為模式庫,根據行為規律提取...
【專利技術屬性】
技術研發人員:王曉林,周鵬飛,馬亮,張新壯,于靜,
申請(專利權)人:北京慧辰資道資訊股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。