System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及網絡安全、人工智能,尤其涉及一種基于大模型的漏洞事件情報預警方法及裝置。
技術介紹
1、隨著互聯網和移動互聯網的飛速發展,網絡環境變得日益復雜,攻擊行為也變得更加產業化和團伙化。傳統的以防御漏洞為主的安全策略難以應對新型、持續性、高級的網絡威脅,因此需要轉變為主動型、以情報為中心的安全建設模式。威脅情報庫的數據來源包括內部情報、專業機構和行業聯盟。內部情報來源于傳統安全設備的攔截、后臺安全分析系統的分析和業務風控系統的發現;專業機構提供多源情報,并在情報沖突時進行人工研判;行業聯盟的威脅情報共享正在研究探索中。在實際操作中,獲取準確、及時和多樣的威脅情報是一個挑戰。同時,如何將威脅情報無縫集成到組織自身的日常漏洞處理流程和機制中,也是技術實施的難點之一。
2、知識抽取技術是自然語言處理(nlp)領域中的一個重要分支,它旨在從非結構化或半結構化的數據源中提取出有價值的信息,并將其轉化為結構化的知識表示。這一技術在許多領域都有廣泛的應用,如信息檢索、問答系統、知識圖譜構建、語義網絡等。隨著互聯網的普及和大數據時代的到來,人們可以輕易地獲取到海量的文本數據。然而,這些數據往往是非結構化的,難以直接用于分析和挖掘。因此,知識抽取技術應運而生,將這些非結構化數據轉化為計算機可理解的結構化知識,從而為人們提供更加智能化的服務。
3、目前漏洞情報預警和分析主要依賴權威數據庫、安全評估以及漏洞管理工具。權威數據庫雖然準確但是有大量漏洞未被cve、cnnvd、cnvd等數據庫收錄,并且0day數據僅占已收錄漏洞的
4、使用大模型直接分析原始漏洞情報會面臨許多困難。首先,未被訓練的大模型在網絡安全漏洞情報相關領域表現很差;其次,未被處理的漏洞情報數據會影響大模型的輸出;最后,大模型在面對大量輸入時耗費算力資源過多。
技術實現思路
1、本申請實施例提供一種基于大模型的漏洞事件情報預警方法及裝置,通過微調后的大語言模型對多個漏洞事件進行分析預警,形成一套基于大模型的漏洞情報事件預警方法。
2、本申請實施例提供一種基于大模型的漏洞事件情報預警方法,包括:
3、獲取與漏洞事件相關的數據信息,并對所獲取的數據信息進行知識抽取,以獲得與漏洞相關的實體和關系;
4、根據抽取的與漏洞相關的實體和關系,利用設定的漏洞情報模板,生成漏洞事件;
5、將生成的漏洞事件輸入預先訓練的漏洞情報大模型,以獲得漏洞簡報和漏洞預警。
6、可選的,獲取與漏洞事件相關的數據信息包括:
7、利用爬蟲解析網頁并爬取指定內容信息,所述內容信息包括日期、作者、論壇和內容;以及,
8、利用bert模型,從爬取的數據信息中篩選出與漏洞事件相關的數據信息。
9、可選的,對所獲取的數據信息進行知識抽取包括:
10、利用bert模型基于篩選的數據信息編碼獲得原始序列信息;
11、提取出所述原始序列信息中的頭實體;
12、根據所述頭實體和原始序列信息的關系,獲取任一關系下可能的尾實體;
13、將可能性最大的實體關系三元組作為抽取的與漏洞相關的實體和關系。
14、可選的,對所獲取的數據信息進行知識抽取具體包括:
15、對篩選的數據信息進行分詞;
16、利用利用bert模型對分詞結果進行編碼處理,以獲得各分詞的隱層表示;
17、對獲得的隱層表示進行解碼,并使用二分類器判斷頭實體開始和結束的位置,其中,所述二分類器用于計算每一個分詞作為開始位置的概率和每一個分詞作為結束位置的概率,當該位置的概率大于預定的閾值的情況下則確定頭實體位置,滿足:
18、pi_start=θ(wstartxi+bstart)
19、pi_end=θ(wendxi+bend)
20、其中,pi_start表示分詞i作為開始位置的概率,pi_end表示分詞i作為開始位置的概率;
21、根據所獲取的頭實體,根據bert隱層向量和識別出的頭實體特征,解碼出每一種關系對應的尾實體的位置,以生成候選三元組;
22、預先定義的規則對生產的候選三元組進行篩選,以獲得與漏洞相關的實體和關系的三元組。
23、可選的,根據抽取的與漏洞相關的實體和關系,利用設定的漏洞情報模板,生成漏洞事件包括:
24、預先根據情報事件要素配置漏洞情報模板;
25、計算篩選出的三元組中相同類型實體的編輯距離,若編輯距離小于等于指定閾值,則確定為同一實體,以確定漏洞三元組;
26、將漏洞三元組按照所述漏洞情報模板進行填充,以生成漏洞事件。
27、可選的,將生成的漏洞事件輸入預先訓練的漏洞情報大模型,以獲得漏洞簡報和漏洞預警包括:
28、基于指定的基座模型執行預訓練;
29、對預訓練的基座模型,使用明確的提示詞來引導模型,以生成針對性回答;以及,
30、結合強化學習方法,使預訓練的基座模型生成多個回答,以獲得漏洞情報大模型,其中所述漏洞情報大模型具有內置的選擇器,以輸出指定數量的回答。
31、可選的,還包括:
32、建立漏洞知識庫;
33、基于所述漏洞情報大模型和所述漏洞知識庫,對風險漏洞進行預警,并輸出預警和簡報。
34、本申請實施例還提出一種基于大模型的漏洞事件情報預警裝置,包括處理器和存儲器,所述存儲器上存儲有計算機程序,所述計算機程序被處理器執行時實現如前述的基于大模型的漏洞事件情報預警方法的步驟。
35、本申請提出了一種基于大模型對漏洞事件情報預警方法,利用訓練好的漏洞情報大模型對大量的漏洞事件進行學習和分析,能夠快速準確生成漏洞預警和簡報??梢栽诼┒次幢粡V泛利用前,為組織的安全管理決策提供有力的支持,避免攻擊者利用漏洞造成損失。
36、上述說明僅是本申請技術方案的概述,為了能夠更清楚了解本申請的技術手段,而可依照說明書的內容予以實施,并且為了讓本申請的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本申請的具體實施方式。
本文檔來自技高網...【技術保護點】
1.一種基于大模型的漏洞事件情報預警方法,其特征在于,包括:
2.如權利要求1所述的基于大模型的漏洞事件情報預警方法,其特征在于,獲取與漏洞事件相關的數據信息包括:
3.如權利要求2所述的基于大模型的漏洞事件情報預警方法,其特征在于,對所獲取的數據信息進行知識抽取包括:
4.如權利要求3所述的基于大模型的漏洞事件情報預警方法,其特征在于,對所獲取的數據信息進行知識抽取具體包括:
5.如權利要求3所述的基于大模型的漏洞事件情報預警方法,其特征在于,根據抽取的與漏洞相關的實體和關系,利用設定的漏洞情報模板,生成漏洞事件包括:
6.如權利要求5所述的基于大模型的漏洞事件情報預警方法,其特征在于,將生成的漏洞事件輸入預先訓練的漏洞情報大模型,以獲得漏洞簡報和漏洞預警包括:
7.如權利要求6所述的基于大模型的漏洞事件情報預警方法,其特征在于,還包括:
8.一種基于大模型的漏洞事件情報預警裝置,其特征在于,包括處理器和存儲器,所述存儲器上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至7中任一
...【技術特征摘要】
1.一種基于大模型的漏洞事件情報預警方法,其特征在于,包括:
2.如權利要求1所述的基于大模型的漏洞事件情報預警方法,其特征在于,獲取與漏洞事件相關的數據信息包括:
3.如權利要求2所述的基于大模型的漏洞事件情報預警方法,其特征在于,對所獲取的數據信息進行知識抽取包括:
4.如權利要求3所述的基于大模型的漏洞事件情報預警方法,其特征在于,對所獲取的數據信息進行知識抽取具體包括:
5.如權利要求3所述的基于大模型的漏洞事件情報預警方法,其特征在于,根據抽取的與漏洞相關的實...
【專利技術屬性】
技術研發人員:何秉鈞,王炳文,孫治,和達,詹國梁,王一凡,張玲,毛得明,
申請(專利權)人:中國電子科技集團公司第三十研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。