本發明專利技術公開了一種可定制裁減的網絡輿情證據保全方法,涉及計算機網絡信息安全技術領域。包括以下步驟:1)采集輿情信息;2)對采集的輿情信息,根據用戶設置的輿情信息過濾規則進行輿情信息過濾,并采用自動情感判別算法和全文檢索算法進行過濾處理;3)對輿情信息進行詞庫匹配;4)對于詞庫匹配成功的輿情信息進行屏幕截屏并保存。該方法采用了自動情感判別算法和全文檢索算法,智能的過濾掉廣告和非主題相關信息,提高了識別率;同時用戶還可以配置輿情信息過濾規則,對輿情信息進行篩選,從而實現用戶根據輿情來源、情感傾向、信息發布時間、關鍵詞等條件定制裁減需要保全的網絡輿情,并為之后的司法維權行為提供有效的電子證據。
【技術實現步驟摘要】
本專利技術涉及計算機網絡信息安全
,尤其涉及一種可定制裁減的網絡輿情證據保全方法。
技術介紹
網絡輿情信息屬于電子證據的一類,互聯網時代網絡輿情信息的影響是巨大的,負面的輿情信息可能小到影響個人的心情、名譽或隱私,大到影響企業的生存、社會秩序甚至國家安全。而輿情信息又具有易篡改易滅失的特點,所以應有預見性保存固定網絡輿情信息,才可在未來的維權中占據主動。通常電子數據要滿足一定的要求才能成為電子證據,其中提取固定電子數據形成的司法鑒定報告是一種重要的證據。當前市場中,很多家互聯網公司都在做網絡輿情信息監控,但是他們僅僅只是對網絡上輿情信息進行收錄,這樣子不能算是證據固定,所以之前沒有什么公司達到證據固定的要求。作為可供司法采信的電子證據,其操作方必須具有相關的電子證據司法鑒定資質,其次對于電子證據的樣式也有特殊的要求。網絡輿情信息和有效的電子證據有以下差別:(1)表現形式上,網絡輿情信息是擴展名為html、htm或php等類型的網頁文件,而有效的電子證據是屏幕截圖,圖片要包含以下要素:應用程序框架、輿情信息地址、消息內容和保全服務器本地時間。這樣一張圖片就包含了輿情信息的來源、內容、提取方法和時間等內容。而網頁文件本身只攜帶了消息內容的信息,證據效力很低。(2)對于顯示超過一個屏幕的網絡輿情信息對應的電子證據是多張圖片,圖片對應了按鍵盤翻頁鍵的各個屏幕截圖。電子證據應包括來源、提取方法、內容和時間等要素,網絡采集引擎采集下來的網頁只包含了內容,而且通常內容有缺失,法律效力弱很多。目前,調用Windows提供的API進行截圖,只能把網頁信息轉化成圖片形式,也是沒有包括所有電子證據應具備的要素。輿情信息過濾是指根據輿情來源、情感傾向、信息發布時間、關鍵詞等條件自動需要保全的網絡輿情。不是所有采集下來的輿情信息都需要進行證據保全,例如正面的輿情信息。目前公開的情感判別算法的誤報率都比較高,后果會造成負面輿情信息被漏掉做證據保全。互聯網輿情信息屬于遠程數字化設備的不可再現數據,其特點是易篡改易滅失,因此輿情信息從被采集、過濾、到證據保全應是一個連續的動作,過濾的速度需要與采集的速度匹配,否則可能導致證據被篡改或滅失。
技術實現思路
本專利技術所要解決的技術問題是提供一種可定制裁減的網絡輿情證據保全方法,該方法采用了自動情感判別算法和全文檢索算法,智能的過濾掉廣告和非主題相關信息,使得程序聚焦于信息內容,提高了識別率;同時用戶還可以配置輿情信息過濾規則,指定要保全的輿情信息的條件,對輿情信息進行篩選,從而實現用戶根據輿情來源、情感傾向、信息發布時間、關鍵詞等條件定制裁減需要保全的網絡輿情,并為之后的司法維權行為提供有效的電子證據。為解決上述技術問題,本專利技術所采取的技術方案是:一種可定制裁減的網絡輿情證據保全方法,包括以下步驟:1)采集輿情信息;2)對采集的輿情信息,根據用戶設置的輿情信息過濾規則進行輿情信息過濾,并采用自動情感判別算法和全文檢索算法進行過濾處理;3)對輿情信息進行詞庫匹配;4)對于詞庫匹配成功的輿情信息進行屏幕截屏并保存。進一步優化的技術方案為所述步驟2)中的自動情感判別算法主要包括以下步驟:A、對于采集的輿情信息進行分詞提取;B、對于提取的分詞進行詞匯抽取;C、根據正面情感詞庫和負面情感詞庫對抽取的詞匯進行情感詞匹配并進行情感詞正面、負面、中性的分值分類判定;D、讀取詞匯,并根據情感分值進行正面輿論、負面輿論、中性輿論的判定。進一步優化的技術方案為所述步驟2)中的全文檢索算法主要包括以下步驟:A、對于采集的輿情信息進行分詞提取;B、將提取的分詞存儲于詞庫;C、進行關鍵詞匹配判定,匹配成功則進行屏幕截屏處理,匹配不成功則進行丟棄處理。進一步優化的技術方案為所述步驟4)中的對于詞庫匹配成功的輿情信息進行屏幕截屏并保存主要包括以下步驟:A、創建運行沙盒,即創建一個運行環境以加載輿情信息;B、分屏截圖,即加載在屏幕上全部輿情信息進行截圖處理;C、保存截圖,即對截圖加載上簽字或水印進行數據保存。采用上述技術方案所產生的有益效果在于:本專利技術采用了自動情感判別算法和全文檢索算法,智能的過濾掉廣告和非主題相關信息,使得程序聚焦于信息內容,提高了識別率;同時用戶還可以配置輿情信息過濾規則,指定要保全的輿情信息的條件,對輿情信息進行篩選,從而實現用戶根據輿情來源、情感傾向、信息發布時間、關鍵詞等條件定制裁減需要保全的網絡輿情,并為之后的司法維權行為提供有效的電子證據。本專利技術是一種應用到輿情監控系統或采集系統中的網絡輿情證據保全技術,其優點在于:(1)保全過程和電子證據符合公安部鑒定標準《數字化設備證據數據發現提取固定方法》GA/T756-2008。(2)網絡輿情采集和證據保全自動完成。(3)可根據輿情來源、情感傾向、信息發布時間、關鍵詞等條件定制裁減需要保全的網絡輿情。附圖說明圖1是本專利技術的原理框圖;圖2是本專利技術自動情感判別算法的原理框圖;圖3是本專利技術全文檢索算法的原理框圖;圖4是本專利技術屏幕截圖的原理框圖。具體實施方式下面將結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本專利技術一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術保護的范圍。如圖1所示,本專利技術公開了一種可定制裁減的網絡輿情證據保全方法,包括以下步驟:1)采集輿情信息;2)對采集的輿情信息,根據用戶設置的輿情信息過濾規則進行輿情信息過濾,并采用自動情感判別算法和全文檢索算法進行過濾處理;3)對輿情信息進行詞庫匹配;4)對于詞庫匹配成功的輿情信息進行屏幕截屏并保存。采用了自動情感判別算法和全文檢索算法,智能的過濾掉廣告和非主題相關信息,使得程序聚焦于信息內容,提高了識別率;同時用戶還可以配置輿情信息過濾規則,指定要保全的輿情信息的條件,對輿情信息進行篩選,從而實現用戶根據輿情來源、情感傾向、信息發布時間、關鍵詞等條件定制裁減需要保全的網絡輿情,并為之后的司法維權行為提供有效的電子證據。如圖2中所示,進一步優化的實施例為上述步驟2)中的自動情感判別算法主要包括以下步驟:A、對于采集的輿情信息進行分詞提取;B、對于提取的分詞進行詞匯抽取;C、根據正面情感詞庫和負面情感詞庫對抽取的詞匯進行情感詞匹配并進行情感詞正面、負面、中性的分值分類判定;D、讀取詞匯,并根據情感分值進行正面輿論、負面輿論、中性輿論的判定。如圖3中所示,進一步優化的實施例為上述步驟2)中的全文檢索算法主要包括以下步驟:A、對于采集的輿情信息進行分詞提取;B、將提取的分詞存儲于詞庫;C、進行關鍵詞匹配判定,匹配成功則進行屏幕截屏處理,匹配不成功則進行丟棄處理。如圖4中所示,進一步優化的實施例為上述步驟4)中的對于詞庫匹配成功的輿情信息進行屏幕截屏并保存主要包括以下步驟:A、創建運行沙盒,即創建一個運行環境以加載輿情信息,是指獲取輿情信息的URL和運行配置信息,在服務器上創建一個運行環境以加載輿情信息,通常是指調用瀏覽器訪問互聯網輿情信息;B、分屏截圖,即加載在屏幕上全部輿情信息進行截圖處理,模擬PageDown按鍵以在屏幕上顯示輿情信息,然后截圖,本文檔來自技高網...

【技術保護點】
一種可定制裁減的網絡輿情證據保全方法,其特征在于:包括以下步驟:1)采集輿情信息;2)對采集的輿情信息,根據用戶設置的輿情信息過濾規則進行輿情信息過濾,并采用自動情感判別算法和全文檢索算法進行過濾處理;3)對輿情信息進行詞庫匹配;4)對于詞庫匹配成功的輿情信息進行屏幕截屏并保存。
【技術特征摘要】
1.一種可定制裁減的網絡輿情證據保全方法,其特征在于:包括以下步驟:1)采集輿情信息;2)對采集的輿情信息,根據用戶設置的輿情信息過濾規則進行輿情信息過濾,并采用自動情感判別算法和全文檢索算法進行過濾處理;3)對輿情信息進行詞庫匹配;4)對于詞庫匹配成功的輿情信息進行屏幕截屏并保存。2.根據權利要求1所述的一種可定制裁減的網絡輿情證據保全方法,其特征在于:所述步驟2)中的自動情感判別算法主要包括以下步驟:A、對于采集的輿情信息進行分詞提取;B、對于提取的分詞進行詞匯抽取;C、根據正面情感詞庫和負面情感詞庫對抽取的詞匯進行情感詞匹配并進行情感詞正面、負面、中性的分值分類判定;D、讀取詞匯,并根據情感分值進...
【專利技術屬性】
技術研發人員:張劍,
申請(專利權)人:深圳市網安計算機安全檢測技術有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。