System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于計算機應用的,具體涉及一種互聯網證據自動采集方法及系統。。
技術介紹
1、隨著互聯網技術的迅猛發展,電子證據在司法程序中的重要性日益凸顯。盡管當前存在多種電子取證平臺,但這些平臺主要是為用戶提供固定證據的輔助工具,取證過程本質上仍以人工操作為主導,相關平臺僅起到證據固定的作用,即確保上傳平臺的證據與最終下載的證據是一致的,不存在修改的可能,但用戶使用該類平臺即使證實了其上傳平臺的證據本身是真實的,也難以確定所采集的證據完整性,難以保證形成了完整的證據鏈,同時,也較難證明證據獲取的整個流程的合法性,以及證據內容的準確性、相關性等關鍵要求。
技術實現思路
1、本專利技術的主要目的在于克服現有技術的缺點與不足,提供一種互聯網證據自動采集方法及系統,通過結合ocr技術和知識圖譜對網絡頁面內容進行智能侵權分析,自動提取關鍵信息,將關鍵信息與法律知識庫關聯生成證據固定策略,提高了互聯網證據采集的質量和效率。
2、為了達到上述目的,本專利技術采用以下技術方案:
3、第一方面,本專利技術提供了一種互聯網證據自動采集方法,包括下述步驟:
4、采集案件相關數據,獲取多維的案件基礎信息;
5、深度整合案件基礎信息,識別關鍵信息點及其證據價值,根據設定評估標準生成涉案原始信息采集策略;
6、執行涉案原始信息采集策略,對涉案網絡頁面內容進行采集,獲取涉案信息;
7、對涉案信息中關鍵信息進行提取,利用知識圖譜將關鍵信息和法律
8、執行證據固定策略,將涉案證據固定,生成證據采集報告,并通過人機交互界面顯示。
9、作為優選的技術方案,所述深度整合案件基礎信息,包括:將采集到的案件基礎信息進行分類,將分類后的信息與預設的信息維度進行比對;所述信息維度包括信息種類和信息所處的平臺。
10、作為優選的技術方案,構建歷史案例庫,包括各種類型的案件和對應的歷史采集策略;
11、將案件基礎信息輸入,利用歷史采集策略根據案件類型識別關鍵信息點,利用決策樹對關鍵信息點進行分類,獲取具有證據價值的關鍵信息點;所述關鍵信息點包括侵權行為、網絡頁面定位信息和電子媒介特征;
12、根據設定評估標準對具有證據價值的關鍵信息點進行評分,將評分結果反饋模型,若能夠有效地采集關鍵信息點時,則將該歷史采集策略權重提高,否則將該歷史采集策略權重降低;不斷優化采集策略,獲取涉案原始信息采集策略。
13、作為優選的技術方案,在執行涉案原始信息采集策略時,如果侵權行為增加,定期采用增量式方法對涉案網絡頁面內容進行采集。
14、作為優選的技術方案,所述涉案原始信息采集策略包括采集對象、采集范圍、采集步驟、采集工具和采集頻率。
15、作為優選的技術方案,所述對涉案信息中關鍵信息進行提取,包括:
16、利用光學字符識別將涉案信息的文字區域切割,根據字符特性識別并提取文本信息,校正文本信息;
17、對涉案物體或者標識進行識別,獲取多媒體信息。
18、作為優選的技術方案,所述利用知識圖譜將關鍵信息和法律知識庫進行關聯,包括:
19、將文本信息和多媒體信息編碼成向量表示,獲取關鍵信息向量;
20、構建知識圖譜,其結構包括法律概念、法律條款和關系;
21、計算關鍵信息向量與知識圖譜之間的相似度,根據設定的閾值將關鍵信息和法律條款進行關聯。
22、作為優選的技術方案,所述生成最優的證據固定策略,包括以下步驟:
23、規則引擎處理:定義專家知識的if-then規則,當關鍵信息與法律知識庫不匹配,則認定為“潛在侵權”,并將相應的關鍵信息進行標記;
24、機器學習模型分類:預訓練機器學習模型,將關鍵信息和關聯結果進行分類,獲取有效證據及其重要程度;
25、混合決策:將規則引擎處理和機器學習模型分類的輸出進行加權投票,根據投票結果確定證據的采集優先級、采集步驟、保存格式和關聯說明,獲取涉案原始信息采集策略。
26、作為優選的技術方案,所述將涉案證據固定,包括:
27、對涉案網絡頁面進行截圖、拍照、打印、視頻錄制或者公證;
28、將涉案證據上傳至區塊鏈;
29、對涉案證據進行加密儲存和訪問控制。
30、第二方面,本專利技術還提供了一種互聯網證據自動采集系統,應用于所述的互聯網證據自動采集方法,包括信息獲取模塊、信息采集方案生成模塊、信息采集模塊、采集內容分析模塊、證據固定模塊和中央控制模塊;
31、信息獲取模塊,用于采集案件相關數據,獲取案件基礎信息;
32、信息采集方案生成模塊,用于識別關鍵信息點及其證據價值,根據設定評估標準生成涉案原始信息采集策略;
33、信息采集模塊,用于執行涉案原始信息采集策略,對涉案網絡頁面內容進行采集,獲取涉案信息;
34、采集內容分析模塊,用于利用光學字符識別對涉案信息中關鍵信息進行提取,利用知識圖譜將關鍵信息和法律知識庫進行關聯,基于規則引擎和機器學習對關聯結果進行處理,生成最優的證據固定策略;所述關鍵信息包括文本信息和多媒體信息;
35、證據固定模塊,用于執行證據固定策略,將涉案證據固定,生成證據采集報告,并將證據采集報告傳輸至人機交互界面;
36、中央控制模塊,用于協調各個模塊的工作,生成證據采集報告,并通過人機交互界面操作和查看證據采集報告。
37、本專利技術與現有技術相比,具有如下優點和有益效果:
38、(1)本專利技術運用自然語言處理技術、圖像識別技術和知識圖譜技術,對采集到的網絡網頁內容進行智能分析,能夠自動提取關鍵信息,并結合法律知識庫生成最優證據固定策略,增強模型魯棒性,從而提高證據采集的效率和準確性。
39、(2)本專利技術基于規則引擎和機器學習對關聯結果進行處理,增強了模型決策能力,確保了采集過程的科學性和針對性,降低了人工成本,提高了證據采集的質量和效率。
40、(3)本專利技術結合現有的歷史案例庫并提供一套清晰的信息采集規則,為后續的實際取證工作提供了清晰、科學的行動指南。
本文檔來自技高網...【技術保護點】
1.一種互聯網證據自動采集方法,其特征在于,包括下述步驟:
2.根據權利要求1所述互聯網證據自動采集方法,其特征在于,所述深度整合案件基礎信息,包括:將采集到的案件基礎信息進行分類,將分類后的信息與預設的信息維度進行比對;所述信息維度包括信息種類和信息所處的平臺。
3.根據權利要求1所述互聯網證據自動采集方法,其特征在于,包括:
4.根據權利要求3所述互聯網證據自動采集方法,其特征在于,在執行涉案原始信息采集策略時,如果侵權行為增加,定期采用增量式方法對涉案網絡頁面內容進行采集。
5.根據權利要求1所述互聯網證據自動采集方法,其特征在于,所述證據采集策略涉案原始信息采集策略包括采集對象、采集范圍、采集步驟、采集工具和采集頻率。
6.根據權利要求1所述互聯網證據自動采集方法,其特征在于,所述對涉案信息中關鍵信息進行提取,包括:
7.根據權利要求1所述互聯網證據自動采集方法,其特征在于,所述利用知識圖譜將關鍵信息和法律知識庫進行關聯,包括:
8.根據權利要求1所述互聯網證據自動采集方法,其特征在于,所
9.根據權利要求1所述互聯網證據自動采集方法,其特征在于,所述將涉案證據固定,包括:
10.一種互聯網證據自動采集系統,其特征在于,應用于權利要求1-9中任一項所述的互聯網證據自動采集方法,包括信息獲取模塊、信息采集方案生成模塊、信息采集模塊、采集內容分析模塊、證據固定模塊和中央控制模塊;
...【技術特征摘要】
1.一種互聯網證據自動采集方法,其特征在于,包括下述步驟:
2.根據權利要求1所述互聯網證據自動采集方法,其特征在于,所述深度整合案件基礎信息,包括:將采集到的案件基礎信息進行分類,將分類后的信息與預設的信息維度進行比對;所述信息維度包括信息種類和信息所處的平臺。
3.根據權利要求1所述互聯網證據自動采集方法,其特征在于,包括:
4.根據權利要求3所述互聯網證據自動采集方法,其特征在于,在執行涉案原始信息采集策略時,如果侵權行為增加,定期采用增量式方法對涉案網絡頁面內容進行采集。
5.根據權利要求1所述互聯網證據自動采集方法,其特征在于,所述證據采集策略涉案原始信息采集策略包括采集對象、采集范圍、采集步驟、采集工具和采集...
【專利技術屬性】
技術研發人員:何驍,操博文,劉翰,陳司旭,何煜欣,
申請(專利權)人:佛山市規律未來智能科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。