本發明專利技術公開了一種基于網絡熱詞識別的惡意樣本捕獲方法及系統,首先,基于社交網絡獲取網絡熱詞;基于預設算法計算所述網絡熱詞的熱度,篩選出熱度超過預設閾值的網絡熱詞添加至熱詞庫;獲取含有熱詞庫中的網絡熱詞并且排名在前的網頁,保存網頁地址到可疑地址表;若所述網頁內含有鏈接地址,則將所述鏈接地址加入可疑地址表;若所述可疑地址表中的網頁地址指向可下載文件,則獲取所述可下載文件;對獲取的網頁地址和可下載文件進行是否惡意的檢測。本發明專利技術所提供的方法及系統,對于被包裝成熱門話題或者資源的惡意代碼有很好的檢出效果。
【技術實現步驟摘要】
本專利技術涉及網絡安全
,尤其涉及一種基于網絡熱詞識別的惡意樣本捕獲方法及系統。
技術介紹
隨著微博和搜索引擎等話題傳播平臺的興起,偽裝成熱門話題或資源的惡意程序正在逐漸成為信息安全領域的一個重大威脅。目前,終端設備上惡意網址和惡意文件數量巨大,雖然用戶有防范心理,但是面對命名為熱門新聞和話題的惡意網址和文件,一旦因好奇被吸引點擊或下載,就會將惡意代碼安裝到終端設備中,并導致惡意代碼通過網絡快速擴散。從實現手段來看,黑客團伙首先建立若干掛馬網站、釣魚網站或通過漏洞入侵和控制其他網站的服務器,然后在網站中添加大量掛馬網頁或在已存在的網頁中添加指向掛馬網頁的超鏈接或彈窗等。掛馬網頁中含有網友關注的熱門詞匯并針對搜索引擎進行了優化,從而提升了搜索引擎中的排名并增加了用戶的信任度,用戶在搜索或查閱熱門詞匯時,一旦點擊進入此類網頁,就會下載惡意代碼到終端設備中,惡意代碼將自動運行并擴散,從而威脅自己和他人的信息安全,可以導致賬號密碼等隱私數據被盜取,進而產生經濟損失。此外,在微博領域,黑客團伙通過添加網絡熱門詞匯和話題或刷微博點擊量等方法,使含有掛馬網頁網址的微博變成熱門微博,用戶在打開感興趣的熱門微博時,如果點擊了微博中含有的鏈接地址,就會進入掛馬網站或釣魚網站。熱門詞匯除了可以用來偽裝惡意網址外,還可以用來偽裝熱門資源,黑客團伙將惡意程序包裝成視頻、游戲和小說等資源并命名為當前熱門話題,網友下載后如果不加注意直接運行,會導致個人信息被泄露并造成經濟損失等嚴重后果。通過將網絡熱詞與惡意網址或資源進行結合,可以保證惡意網址或資源在搜索引擎和微博中的熱度和關注度,吸引大量用戶點擊或下載,從而快速廣泛地傳播。事實上,從用戶行為的角度來看,因為搜索網絡熱詞而導致進入惡意網址或下載惡意文件的行為,有以下幾個步驟: 從搜索引擎或微博的熱門話題榜中找到感興趣的話題或關鍵詞; 通過關鍵詞在搜索引擎或微博中搜索相應的排名靠前的網頁或微博; 點擊搜索到的網址,進入網頁;點擊搜索到的微博,進入網頁或下載文件。經過分析發現,目前針對網絡熱詞可能帶來的安全威脅,并沒有可靠的檢測方法。
技術實現思路
針對上述技術問題,本專利技術提供了一種基于網絡熱詞識別的惡意樣本捕獲方法及系統,所述方法通過搜集網絡熱詞,基于所述網絡熱詞獲取相關網頁地址和可下載文件,對上述網頁地址和可下載文件進行是否惡意的檢測,從而有效捕獲與網絡熱詞相關的惡意代碼。本專利技術采用如下方法來實現:一種基于網絡熱詞識別的惡意樣本捕獲方法,包括: 基于社交網絡獲取網絡熱詞; 基于預設算法計算所述網絡熱詞的熱度,篩選出熱度超過預設閾值的網絡熱詞添加至熱詞庫; 獲取含有熱詞庫中的網絡熱詞并且排名在前的網頁,保存網頁地址到可疑地址表;若所述網頁內含有鏈接地址,則將所述鏈接地址加入可疑地址表; 若所述可疑地址表中的網頁地址指向可下載文件,則獲取所述可下載文件; 對獲取的網頁地址和可下載文件進行是否惡意的檢測。進一步地,所述基于社交網絡獲取網絡熱詞,還包括:獲取網絡熱點話題,提取網絡熱點話題的關鍵詞作為網絡熱詞。進一步地,所述預設算法為:統計所述網絡熱詞的出現次數和下載頻率,基于預設權值計算所述網絡熱詞的熱度。進一步地,所述對獲取的網頁地址和可下載文件進行是否惡意的檢測為:調用具備惡意網頁地址和惡意文件檢測能力的外部檢測模塊進行檢測。進一步地,所述對獲取的網頁地址和可下載文件進行是否惡意的檢測后,還包括:將檢測為惡意的網頁地址添加至惡意網址列表中,將檢測為惡意的可下載文件添加至惡意文件庫中。本專利技術采用如下系統來實現:一種基于網絡熱詞識別的惡意樣本捕獲系統,包括: 熱詞捕獲模塊,用于基于社交網絡獲取網絡熱詞; 熱度計算模塊,用于基于預設算法計算所述網絡熱詞的熱度,篩選出熱度超過預設閾值的網絡熱詞添加至熱詞庫; 可疑地址獲取模塊,用于獲取含有熱詞庫中的網絡熱詞并且排名在前的網頁,保存網頁地址到可疑地址表;若所述網頁內含有鏈接地址,則將鏈接地址加入可疑地址表; 可下載文件獲取模塊,用于若所述可疑地址表中的網頁地址指向可下載文件,則獲取所述可下載文件; 檢測模塊,用于對可疑地址獲取模塊獲取的網頁地址和可下載文件獲取模塊獲取的可下載文件進行是否惡意的檢測。進一步地,所述基于社交網絡獲取網絡熱詞,還包括:獲取網絡熱點話題,提取網絡熱點話題的關鍵詞作為網絡熱詞。進一步地,所述預設算法為:統計所述網絡熱詞的出現次數和下載頻率,基于預設權值計算所述網絡熱詞的熱度。進一步地,所述檢測模塊為具備惡意網頁地址和惡意文件檢測能力的外部檢測模塊。進一步地,還包括入庫模塊,用于將檢測為惡意的網頁地址添加至惡意網址列表中,將檢測為惡意的可下載文件添加至惡意文件庫中。綜上所述,本專利技術提供了一種基于網絡熱詞識別的惡意樣本捕獲方法及系統,首先基于不同的社交網絡平臺獲取網絡熱詞,并提取出熱度在預設閾值以上的網絡熱詞,從而獲取含有該網絡熱詞的網頁地址和可下載文件,利用第三方檢測模塊對所述網頁地址和可下載文件進行是否惡意的檢測。本專利技術基于普通用戶在面對網絡熱詞時,可能采取的操作,從而分析感染惡意代碼的途徑,并提出利用網絡熱詞識別的惡意樣本捕獲方法和捕獲系統,從而有效檢測被包裝成為熱門詞匯或者熱門話題的惡意代碼。【附圖說明】為了更清楚地說明本專利技術的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術中記載的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1為本專利技術提供的一種基于網絡熱詞識別的惡意樣本捕獲方法實施例流程圖; 圖2為本專利技術提供的一種基于網絡熱詞識別的惡意樣本捕獲系統實施例結構圖。【具體實施方式】本專利技術給出了一種基于網絡熱詞識別的惡意樣本捕獲方法及系統,為了使本
的人員更好地理解本專利技術實施例中的技術方案,并使本專利技術的上述目的、特征和優點能夠更加明顯易懂,下面結合附圖對本專利技術中技術方案作進一步詳細的說明: 本專利技術首先提供了一種基于網絡熱詞識別的惡意樣本捕獲方法實施例,如圖1所示,包括: SlOl基于社交網絡獲取網絡熱詞; 所述社交網絡包括有一定知名度、使用量大并且提供分析結果的社交平臺或軟件、手機APP等,不只限于搜索引擎和微博,此處以搜索引擎和微博進行舉例說明: 例如:a、基于搜索弓I擎獲取網絡熱詞的方法為,從詞匯搜索量排行榜中獲取網絡熱詞,通過記錄搜索引擎和對應的詞匯搜索量排行榜,通過爬蟲程序自動獲取近期預設時間段的網絡熱詞,并進行保存; b、基于微博獲取網絡熱詞的方法為,從微博服務商提供的熱門主題榜和熱門話題榜中獲取關注度較高的網絡熱詞,通過記錄微博和對應的熱門話題榜,獲取近期預設時間段的網絡熱詞,并進行保存; S102基于預設算法計算所述網絡熱詞的熱度; S103篩選出熱度超過預設閾值的網絡熱詞添加至熱詞庫; S104獲取含有熱詞庫中的網絡熱詞并且排名在前的網頁,保存網頁地址到可疑地址表; S105若所述網頁內含有鏈當前第1頁1 2 本文檔來自技高網...
【技術保護點】
一種基于網絡熱詞識別的惡意樣本捕獲方法,其特征在于,包括:基于社交網絡獲取網絡熱詞;基于預設算法計算所述網絡熱詞的熱度,篩選出熱度超過預設閾值的網絡熱詞添加至熱詞庫;獲取含有熱詞庫中的網絡熱詞并且排名在前的網頁,保存網頁地址到可疑地址表;若所述網頁內含有鏈接地址,則將所述鏈接地址加入可疑地址表;若所述可疑地址表中的網頁地址指向可下載文件,則獲取所述可下載文件;對獲取的網頁地址和可下載文件進行是否惡意的檢測。
【技術特征摘要】
【專利技術屬性】
技術研發人員:童志明,陳文博,肖新光,
申請(專利權)人:哈爾濱安天科技股份有限公司,
類型:發明
國別省市:黑龍江;23
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。