System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及網絡安全,尤其涉及一種基于大模型的軟件供應鏈威脅監測方法及裝置。
技術介紹
1、隨著開源軟件供應鏈體系越來越龐大,威脅的滲入點不斷增多,分布在開源軟件供應鏈的各個環節。其中,通過軟件供應商、漏洞發布平臺、社交論壇等互聯網發布平臺收集軟件供應鏈相關的各類情報數據,找出潛在的威脅并進行監測預警,能夠幫助網絡安全相關從業者快速感知軟件供應鏈存在的安全風險并做出相應處置。因此,對軟件供應鏈威脅進行監測預警是一件很有意義的任務。
2、軟件供應鏈涉及多方面、多環節的知識,數據規模大,且具備廣泛關聯關系。傳統的軟件供應鏈威脅監測方法主要依靠專家經驗和手工分析,缺乏系統性和自動化,難以應對復雜的軟件供應鏈關系和海量的數據處理需求。
技術實現思路
1、本申請實施例提供一種基于大模型的軟件供應鏈威脅監測方法及裝置,通過訓練軟件供應鏈安全領域大模型,構建監測報告生成任務數據集對大模型進行微調,具備軟件供應鏈威脅監測報告生成,利用近期的軟件供應鏈原始情報數據作為大模型輸入生成監測報告,實現對軟件供應鏈威脅監測的功能。
2、本申請實施例提供一種基于大模型的軟件供應鏈威脅監測方法,包括:
3、預先基于軟件供應鏈安全相關數據,訓練大模型;
4、基于訓練后大模型,構建大模型微調數據集;
5、利用所構建的大模型微調數據集,對訓練后的大模型進行指令微調;
6、基于知識圖譜構建軟件供應鏈知識庫;
7、根據指令微調后的大模型以及
8、基于指令微調后的大模型,按照設定的監測報告模板生成軟件供應鏈威脅監測報告。
9、可選地,預先基于軟件供應鏈安全相關數據,訓練大模型包括:
10、利用爬蟲,在互聯網爬取軟件供應鏈安全相關數據;
11、對爬取的軟件供應鏈安全相關數據進行數據預處理,以構建軟件供應鏈文本數據集,其中數據預處理包括數據清洗和格式化;
12、基于構建的軟件供應鏈文本數據集對大模型進行全參訓練。
13、可選地,基于訓練后大模型,構建大模型微調數據集包括:
14、根據軟件供應鏈情報數據是否為權威平臺發布的軟件供應鏈威脅報告,將軟件供應鏈情報數據分類;
15、根據軟件供應鏈威脅報告,根據其發布的時間節點,獲取所述時間節點前指定期間的軟件供應鏈原始情報數據,并基于軟件供應鏈原始情報數據和軟件供應鏈威脅報告構建數據記錄;
16、預先構建實體關系抽取模型,對所構建的第一數據記錄,進行實體關系抽取,以利用獲得的實體關系三元組構建大模型微調數據集。
17、可選地,基于訓練后大模型,構建大模型微調數據集還包括:
18、確定所述數據記錄中包含多個原始情報數據記錄的情況下,針對任一條原始情報數據,通過構建二分類模型判斷其與軟件供應鏈威脅報告是否相關,保留相關的任一條原始情報數據。
19、可選地,利用所構建的大模型微調數據集,對訓練后的大模型進行指令微調包括:
20、將構建的大模型微調數據集中的三元組數據展開為文本數據;
21、根據設定的監測報告模板,將所述文本數據進行格式化處理,并根據格式化處理后的文本數據,利用定義的監測報告生成任務,對所述大模型進行二次訓練。
22、可選地,基于知識圖譜構建軟件供應鏈知識庫包括:
23、根據軟件供應鏈原始情報數據,進行知識提取,以獲得實體關系三元組數據;
24、對提取的關系三元組數據進行實體對齊、知識融合處理,以構建軟件供應鏈知識圖譜,所構建的軟件供應鏈知識圖譜包括漏洞相關數據和軟件組件元數據。
25、可選地,根據指令微調后的大模型以及所構建的軟件供應鏈知識庫,對于獲取的待監測的軟件供應鏈數據進行檢測包括:
26、利用實體關系抽取模型對待監測的軟件供應鏈數據進行實體關系抽取;
27、計算所抽取的實體關系三元組中各個實體的熱度,并確定熱度靠前的實體作為監測對象,其中所述熱度用于描述涉及該實體的原始情報數據數量;以及,
28、將所抽取的實體關系三元組展開,基于展開獲得的文本序列在所述軟件供應鏈知識圖譜進行檢索,以獲得關聯知識;
29、將監測對象、檢索的關聯知識和展開的文本輸入指令微調后的大模型,以進行檢測。
30、本申請實施例還提出一種基于大模型的軟件供應鏈威脅監測裝置,包括處理器和存儲器,所述存儲器上存儲有計算機程序,所述計算機程序被處理器執行時實現如前述的基于大模型的軟件供應鏈威脅監測方法的步驟。
31、本申請實施例通過訓練軟件供應鏈安全領域大模型,構建監測報告生成任務數據集對大模型進行微調,使其具備軟件供應鏈威脅監測報告生成能力,利用近期的軟件供應鏈原始情報數據作為大模型輸入生成監測報告,實現對軟件供應鏈威脅監測的功能。
32、上述說明僅是本申請技術方案的概述,為了能夠更清楚了解本申請的技術手段,而可依照說明書的內容予以實施,并且為了讓本申請的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本申請的具體實施方式。
本文檔來自技高網...【技術保護點】
1.一種基于大模型的軟件供應鏈威脅監測方法,其特征在于,包括:
2.如權利要求1所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,預先基于軟件供應鏈安全相關數據,訓練大模型包括:
3.如權利要求2所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,基于訓練后大模型,構建大模型微調數據集包括:
4.如權利要求3所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,基于訓練后大模型,構建大模型微調數據集還包括:
5.如權利要求3所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,利用所構建的大模型微調數據集,對訓練后的大模型進行指令微調包括:
6.如權利要求5所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,基于知識圖譜構建軟件供應鏈知識庫包括:
7.如權利要求5所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,根據指令微調后的大模型以及所構建的軟件供應鏈知識庫,對于獲取的待監測的軟件供應鏈數據進行檢測包括:
8.一種基于大模型的軟件供應鏈威脅監測裝置,其特征在于,包括處理器和存儲器,
...【技術特征摘要】
1.一種基于大模型的軟件供應鏈威脅監測方法,其特征在于,包括:
2.如權利要求1所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,預先基于軟件供應鏈安全相關數據,訓練大模型包括:
3.如權利要求2所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,基于訓練后大模型,構建大模型微調數據集包括:
4.如權利要求3所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,基于訓練后大模型,構建大模型微調數據集還包括:
5.如權利要求3所述的基于大模型的軟件供應鏈威脅監測方法,其特征在于,利用所構建的大模型微調數據集...
【專利技術屬性】
技術研發人員:王炳文,孫治,和達,韓燁,權趙恒,何秉鈞,張玲,毛得明,
申請(專利權)人:中國電子科技集團公司第三十研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。