"/>
【技術實現步驟摘要】
訴訟文件分析方法、模型訓練方法、裝置、設備及介質
[0001]本申請涉及人工智能
,尤其是一種訴訟文件分析方法
、
訓練方法
、
裝置
、
設備及介質
。
技術介紹
[0002]司法機構面臨各種類型案件的訴訟文件時,由于訴訟文件的內容較為冗長且用詞較為晦澀難懂,很難快速從訴訟文件中準確提取訴訟文件中各種法律信息之間的關聯和依賴關系
。
因此,對法律信息的優化處理和管理對于提高司法效率及公正性具有重要的意義
。
[0003]目前,對于訴訟文件的法律信息的處理和分析方法依賴人工操作,通過摘取主要信息段落或者句子,然后進行實體標注和句法分析
。
然而,句法分析需要分析整個段落或者句子的語義和結構,分析的效率和準確率低下
。
技術實現思路
[0004]本申請的目的是提供一種訴訟文件分析方法
、
訓練方法
、
裝置
、
設備及介質,旨在提升提取訴訟文件中各種法律信息之間的關聯和依賴關系的效率和準確率
。
[0005]本申請實施例提供一種訴訟文件分析方法,包括:以訴訟文件和訴訟文件中的目標實體作為頂點,基于頂點之間的關聯性構建超邊,使用頂點和超邊構建訴訟超圖;所述目標實體為訴訟文件中與訴訟案件相關的實體;使用訓練好的超圖卷積網絡模型對訴訟超圖進行信息傳播和特征學習,得到頂點特征向量;基于貝葉斯推斷,計算頂點特征向量屬于預設的法律屬性標 ...
【技術保護點】
【技術特征摘要】
1.
一種訴訟文件分析方法,其特征在于,包括:以訴訟文件和訴訟文件中的目標實體作為頂點,基于頂點之間的關聯性構建超邊,使用頂點和超邊構建訴訟超圖;所述目標實體為訴訟文件中與訴訟案件相關的實體;使用訓練好的超圖卷積網絡模型對訴訟超圖進行信息傳播和特征學習,得到頂點特征向量;基于貝葉斯推斷,計算頂點特征向量屬于預設的法律屬性標簽的后驗概率,使用最大后驗概率對頂點特征向量進行法律屬性推斷,以預測頂點特征向量對應的法律屬性標簽,得到預測標簽;根據預測標簽的法律屬性確定預測標簽之間的關聯信息,使用預測標簽和預測標簽之間的關聯信息構建關系信息鏈
。2.
根據權利要求1所述的訴訟文件分析方法,其特征在于,所述以訴訟文件和訴訟文件中的目標實體作為頂點,基于頂點之間的關聯性構建超邊,使用頂點和超邊構建訴訟超圖,包括:識別訴訟文件中的目標實體,以構建頂點集和超邊集;對訴訟文件的文本內容進行信息提取,將提取得到的關鍵信息對應分配至頂點和超邊,分別作為頂點的特征向量和超邊的特征向量;利用超圖嵌入方法將頂點映射至嵌入空間,利用訓練好的嵌入向量替代原先頂點的特征向量,得到頂點的嵌入向量;計算超邊的特征向量和對應頂點的嵌入向量的點積,得到超邊的權重;使用頂點的嵌入向量更新頂點集,使用超邊的權重更新超邊集,使用更新后的頂點集和超邊集構建訴訟超圖
。3.
根據權利要求1所述的訴訟文件分析方法,其特征在于,所述使用訓練好的超圖卷積網絡模型對訴訟超圖進行信息傳播和特征學習,得到頂點特征向量,包括:將訴訟超圖的鄰接矩陣和度矩陣輸入預先訓練好的超圖卷積網絡模型,進行逐層圖卷積操作,對最后一次圖卷積操作的輸出結果進行法律屬性分類,得到每個頂點的頂點特征向量;所述超圖卷積網絡模型由多個超圖卷積層以及位于最后一個全連接層堆疊而成;所述超圖卷積層的計算公式為:,其中,
H
(l+1)
為第
l+1
個超圖卷積層的輸出結果,
σ
為非線性激活函數,
D
為度矩陣,
A
為鄰接矩陣,
H
(l)
為第
l
個超圖卷積層的輸出結果,
W
(l)
為第
l
個超圖卷積層的權重參數矩陣,
l=1,2,3,...,L
,
L
為超圖卷積層的數量;所述頂點特征向量的計算公式為:,其中,
F
為頂點特征向量,
H
(L)
為第
L
個超圖卷積層的輸出結果,
W
(L)
為全連接層的權重矩陣
。4.
根據權利要求1所述的訴訟文件分析方法,其特征在于,所述基于貝葉斯推斷,計算
頂點特征向量屬于預設的法律屬性標簽的后驗概率,使用最大后驗概率對頂點特征向量進行法律屬性推斷,以預測頂點特征向量對應的法律屬性標簽,得到預測標簽,包括:根據法律屬性標簽的歷史概率確定頂點特征向量屬于對應法律屬性標簽的先驗概率;設定頂點特征向量關于法律屬性標簽的條件概率分布;使用先驗概率
、
條件概率分布和頂點特征向量的邊緣概率計算頂點特征向量屬于對應法律屬性標簽的后驗概率,以最大后驗概率對應的法律屬性標簽作為頂點特征向量的預測標簽
...
【專利技術屬性】
技術研發人員:胡為民,鄭喜,謝麗慧,譚梁,
申請(專利權)人:深圳市迪博企業風險管理技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。