System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本申請涉及文本處理,尤其是一種匹配案件與法條的方法、裝置、設備及介質。
技術介紹
1、隨著自然語言技術的不斷發(fā)展,尤其是預訓練語言模型的發(fā)展,自然語言處理技術在法律領域的應用得到發(fā)展,例如,用于案由分類、法規(guī)匹配等,主要是根據(jù)案件與法規(guī)中的關鍵詞來確定與案件對應的案由或法條。
2、然而,根據(jù)案件描述文本與法條中的關鍵詞進行相應法規(guī)的匹配,忽略了案件描述文本中各相關關鍵詞之間的語義聯(lián)系,使得案件可能匹配到其他類別的法規(guī),增加了案件描述文本與相應法規(guī)匹配失誤的可能性。
技術實現(xiàn)思路
1、本申請的目的是提供一種匹配案件與法條的方法、裝置、設備及介質,結合案件與法條兩者的語義信息進行匹配,可以提高案件與法條匹配的準確率。
2、本申請實施例提供一種匹配案件與法條的方法,包括:
3、獲取案件內容文本和法條內容文本;
4、將所述案件內容文本輸入第一語義提取模型,對所述案件內容文本進行上下文語義提取和基于上下文語義提取結果的局部語義提取,得到第一語義向量序列;所述第一語義向量序列包含所述案件內容文本中爭議焦點內容和事實認定內容兩者的上下文時序信息和局部語義信息;
5、將所述法條內容文本輸入第二語義提取模型,對所述法條內容文本進行局部語義提取以及基于局部語義提取結果的上下文語義提取和全局語義提取,得到第二語義向量序列;所述第二語義向量序列包含所述法條內容文本中法條內容的局部語義信息、上下文時序信息和全局語義信息;
6、根據(jù)所述第
7、在一些實施例中,所述第一語義提取模型包括第一上下文語義提取層和第一卷積網(wǎng)絡層,所述將所述案件內容文本輸入第一語義提取模型,對所述案件內容文本進行上下文語義提取和基于上下文語義提取結果的局部語義提取,得到第一語義向量序列,包括:
8、對所述案件內容文本進行詞向量嵌入,得到案件詞向量序列;
9、將所述案件詞向量序列輸入所述第一上下文語義提取層,對所述案件詞向量序列進行上下文語義提取,得到第一上下文語義向量序列;
10、將所述第一上下文語義向量序列輸入所述第一卷積網(wǎng)絡層,對所述第一上下文語義向量序列進行卷積操作,得到第一局部語義向量序列;
11、拼接所述第一上下文語義向量序列與所述第一局部語義向量序列,得到所述第一語義向量序列。
12、在一些實施例中,所述將所述案件詞向量序列輸入所述第一上下文語義提取層,對所述案件詞向量序列進行上下文語義提取,得到第一上下文語義向量序列,包括:
13、調用所述第一上下文語義提取層中的前向編碼網(wǎng)絡,對所述案件詞向量序列進行編碼,得到前向隱式狀態(tài)序列;
14、調用所述第一上下文語義提取層中的后向編碼網(wǎng)絡,對所述案件詞向量序列進行編碼,得到后向隱式狀態(tài)序列;
15、拼接所述前向隱式狀態(tài)序列和所述后向隱式狀態(tài)序列,得到第一上下文語義向量,匯總所述第一上下文語義向量,得到所述第一上下文語義向量序列。
16、在一些實施例中,所述第二語義提取模型包括第二卷積網(wǎng)絡層、第二上下文語義提取層和全局語義提取層,所述將所述法條內容文本輸入第二語義提取模型,對所述法條內容文本進行局部語義提取以及基于局部語義提取結果的上下文語義提取和全局語義提取,得到第二語義向量序列,包括:
17、對所述法條內容文本進行詞向量嵌入,得到法條詞向量序列;
18、將所述法條詞向量序列輸入所述第二卷積網(wǎng)絡層,對所述法條詞向量序列進行卷積操作,得到第二局部語義向量序列;
19、將所述第二局部語義向量序列輸入所述第二上下文語義提取層,對所述第二局部語義向量序列進行上下文語義提取,得到第二上下文語義向量序列;
20、將所述第二上下文語義向量序列輸入所述全局語義提取層,對所述第二上下文語義向量序列進行注意力權重運算,得到全局語義向量序列;
21、拼接所述第二上下文語義向量序列與所述全局語義向量序列,得到所述第二語義向量序列。
22、在一些實施例中,所述將所述第二局部語義向量序列輸入所述第二上下文語義提取層,對所述第二局部語義向量序列進行上下文語義提取,得到第二上下文語義向量序列,包括:
23、將所述第二局部語義向量序列中的第二局部語義向量分別輸入所述第二上下文語義提取層中的各個語義編碼網(wǎng)絡,以上一所述語義編碼網(wǎng)絡的編碼輸出和所述第二局部語義向量作為輸入并進行編碼,得到第二上下文語義向量,匯總所述第二上下文語義向量,得到所述第二上下文語義向量序列。
24、在一些實施例中,所述根據(jù)所述第一語義向量序列和所述第二語義向量序列,將所述法條內容文本中相應的法條與所述案件內容文本的案件進行匹配,包括:
25、計算所述第一語義向量序列和所述第二語義向量序列之間的序列相似度;
26、在所述序列相似度大于預設的相似度閾值時,將該所述序列相似度對應的法條與所述案件內容文本的案件進行匹配。
27、在一些實施例中,所述的匹配案件與法條的方法,還包括:
28、構建訓練樣本對;所述訓練樣本對包括樣本案件語義向量序列、第一樣本法條語義向量序列和第二樣本法條語義向量序列,所述樣本案件語義向量序列為將樣本案件內容文本輸入預設的第一原始模型得到,所述第一樣本法條語義向量序列和所述第二樣本法條語義向量序列均為將相應的樣本法條內容文本輸入預設的第二原始模型得到,所述樣本案件語義向量序列和所述第一樣本法條語義向量序列的序列相似度大于預設的相似度閾值,所述樣本案件語義向量序列和所述第二樣本法條語義向量序列的序列相似度不大于預設的相似度閾值;
29、計算所述訓練樣本對的三元組損失值;
30、采用梯度下降方法,基于所述三元組損失值,更新所述第一原始模型和所述第一原始模型兩者的權重參數(shù),在所述三元組損失值符合結束條件時,得到所述第一語義提取模型和所述第二語義提取模型。
31、本申請實施例還提供一種匹配案件與法條的裝置,包括:
32、第一模塊,用于獲取案件內容文本和法條內容文本;
33、第二模塊,用于將所述案件內容文本輸入第一語義提取模型,對所述案件內容文本進行上下文語義提取和基于上下文語義提取結果的局部語義提取,得到第一語義向量序列;所述第一語義向量序列包含所述案件內容文本中爭議焦點內容和事實認定內容兩者的上下文時序信息和局部語義信息;
34、第三模塊,用于將所述法條內容文本輸入第二語義提取模型,對所述法條內容文本進行局部語義提取以及基于局部語義提取結果的上下文語義提取和全局語義提取,得到第二語義向量序列;所述第二語義向量序列包含所述法條內容文本中法條內容的局部語義信息、上下文時序信息和全局語義信息;
35、第四模塊,用于根據(jù)所述第一語義向量序列和所述第二語義向量本文檔來自技高網(wǎng)...
【技術保護點】
1.一種匹配案件與法條的方法,其特征在于,包括:
2.根據(jù)權利要求1所述的匹配案件與法條的方法,其特征在于,所述第一語義提取模型包括第一上下文語義提取層和第一卷積網(wǎng)絡層,所述將所述案件內容文本輸入第一語義提取模型,對所述案件內容文本進行上下文語義提取和基于上下文語義提取結果的局部語義提取,得到第一語義向量序列,包括:
3.根據(jù)權利要求2所述的匹配案件與法條的方法,其特征在于,所述將所述案件詞向量序列輸入所述第一上下文語義提取層,對所述案件詞向量序列進行上下文語義提取,得到第一上下文語義向量序列,包括:
4.根據(jù)權利要求1所述的匹配案件與法條的方法,其特征在于,所述第二語義提取模型包括第二卷積網(wǎng)絡層、第二上下文語義提取層和全局語義提取層,所述將所述法條內容文本輸入第二語義提取模型,對所述法條內容文本進行局部語義提取以及基于局部語義提取結果的上下文語義提取和全局語義提取,得到第二語義向量序列,包括:
5.根據(jù)權利要求4所述的匹配案件與法條的方法,其特征在于,所述將所述第二局部語義向量序列輸入所述第二上下文語義提取層,對所述第二局部語義向
6.根據(jù)權利要求1所述的匹配案件與法條的方法,其特征在于,所述根據(jù)所述第一語義向量序列和所述第二語義向量序列,將所述法條內容文本中相應的法條與所述案件內容文本的案件進行匹配,包括:
7.根據(jù)權利要求1至6任一項所述的匹配案件與法條的方法,其特征在于,所述的匹配案件與法條的方法,還包括:
8.一種匹配案件與法條的裝置,其特征在于,包括:
9.一種電子設備,其特征在于,所述電子設備包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)權利要求1至7任一項所述的匹配案件與法條的方法。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1至7中任一項所述的匹配案件與法條的方法。
...【技術特征摘要】
1.一種匹配案件與法條的方法,其特征在于,包括:
2.根據(jù)權利要求1所述的匹配案件與法條的方法,其特征在于,所述第一語義提取模型包括第一上下文語義提取層和第一卷積網(wǎng)絡層,所述將所述案件內容文本輸入第一語義提取模型,對所述案件內容文本進行上下文語義提取和基于上下文語義提取結果的局部語義提取,得到第一語義向量序列,包括:
3.根據(jù)權利要求2所述的匹配案件與法條的方法,其特征在于,所述將所述案件詞向量序列輸入所述第一上下文語義提取層,對所述案件詞向量序列進行上下文語義提取,得到第一上下文語義向量序列,包括:
4.根據(jù)權利要求1所述的匹配案件與法條的方法,其特征在于,所述第二語義提取模型包括第二卷積網(wǎng)絡層、第二上下文語義提取層和全局語義提取層,所述將所述法條內容文本輸入第二語義提取模型,對所述法條內容文本進行局部語義提取以及基于局部語義提取結果的上下文語義提取和全局語義提取,得到第二語義向量序列,包括:
5.根據(jù)權利要求4所述的匹配案件與法條的...
【專利技術屬性】
技術研發(fā)人員:陳賽霞,張麗,馮青青,
申請(專利權)人:深圳市迪博企業(yè)風險管理技術有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。