System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲av永久无码精品秋霞电影影院,成人无码A区在线观看视频,久久青青草原亚洲AV无码麻豆
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于代碼和語義特征的漏洞負(fù)載分類方法及系統(tǒng)技術(shù)方案

    技術(shù)編號:44332359 閱讀:9 留言:0更新日期:2025-02-18 20:40
    本發(fā)明專利技術(shù)公開一種基于代碼和語義特征的漏洞負(fù)載分類方法及系統(tǒng),屬于入侵檢測技術(shù)領(lǐng)域。所述方法包括:編碼漏洞負(fù)載,并對編碼結(jié)果進(jìn)行掩碼后,通過預(yù)測掩碼值得到所述漏洞負(fù)載的第一表征;基于TF?IDF編碼器獲取所述漏洞負(fù)載的第二表征;綜合所述第一表征和所述第二表征,得到所述漏洞負(fù)載的綜合表征;對所述綜合表征進(jìn)行分類,得到所述漏洞負(fù)載的分類結(jié)果。本發(fā)明專利技術(shù)通過增強(qiáng)漏洞負(fù)載的表征能力,提高了漏洞檢測的精準(zhǔn)率。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)屬于入侵檢測,尤其涉及一種基于代碼和語義特征的漏洞負(fù)載分類方法及系統(tǒng)


    技術(shù)介紹

    1、當(dāng)前,入侵檢測系統(tǒng)在網(wǎng)絡(luò)安全領(lǐng)域扮演著至關(guān)重要的角色。隨著網(wǎng)絡(luò)攻擊手段的不斷演變和復(fù)雜化,傳統(tǒng)的入侵檢測方法主要依賴于規(guī)則匹配和經(jīng)典的機(jī)器學(xué)習(xí)技術(shù)。然而,面對日益多樣化和復(fù)雜的新型攻擊場景,這些方法往往表現(xiàn)出較高的誤報率和漏報率,特別是在漏洞負(fù)載檢測方面更是如此。傳統(tǒng)方法難以提供對漏洞攻擊負(fù)載的細(xì)粒度識別和分類,從而限制了安全威脅的準(zhǔn)確評估和快速響應(yīng)能力。

    2、隨著深度學(xué)習(xí)技術(shù)的不斷進(jìn)步,為漏洞負(fù)載分類帶來了新的發(fā)展機(jī)遇。卷積神經(jīng)網(wǎng)絡(luò)(cnn)、循環(huán)神經(jīng)網(wǎng)絡(luò)(rnn)以及基于transformer的模型能夠自動從大規(guī)模數(shù)據(jù)中提取特征,并實(shí)現(xiàn)精準(zhǔn)的檢測和分類。然而,目前通用預(yù)訓(xùn)練模型在漏洞負(fù)載領(lǐng)域的適應(yīng)性較為有限,因此專門針對漏洞負(fù)載進(jìn)行預(yù)訓(xùn)練的模型顯得尤為重要。

    3、通過預(yù)訓(xùn)練,模型能夠深入學(xué)習(xí)和理解漏洞負(fù)載的語義和結(jié)構(gòu)特征,從而顯著提升在多種漏洞負(fù)載分類任務(wù)中的表征能力,這種精細(xì)化的表征使得模型在多種漏洞負(fù)載分類的下游任務(wù)中能夠?qū)崿F(xiàn)更高的精確度和效率,從而實(shí)現(xiàn)更加精準(zhǔn)和高效的漏洞負(fù)載檢測和分類。


    技術(shù)實(shí)現(xiàn)思路

    1、針對現(xiàn)有技術(shù)存在的不足和缺陷,本專利技術(shù)提供了一種基于代碼和語義特征的漏洞負(fù)載分類方法及系統(tǒng),旨在通過增強(qiáng)漏洞負(fù)載的表征能力,提高漏洞檢測的精準(zhǔn)率。

    2、為實(shí)現(xiàn)上述專利技術(shù)目的,本專利技術(shù)的技術(shù)方案包括以下內(nèi)容。

    3、一種基于代碼和語義特征的漏洞負(fù)載分類方法,所述方法包括:

    4、編碼漏洞負(fù)載,并對編碼結(jié)果進(jìn)行掩碼后,通過預(yù)測掩碼值得到所述漏洞負(fù)載的第一表征;

    5、基于tf-idf編碼器獲取所述漏洞負(fù)載的第二表征;

    6、綜合所述第一表征和所述第二表征,得到所述漏洞負(fù)載的綜合表征;

    7、對所述綜合表征進(jìn)行分類,得到所述漏洞負(fù)載的分類結(jié)果。

    8、進(jìn)一步地,所述編碼漏洞負(fù)載,并對編碼結(jié)果進(jìn)行掩碼包括:

    9、收集并構(gòu)建包括漏洞信息和負(fù)載信息的預(yù)訓(xùn)練語料庫;

    10、基于所述預(yù)訓(xùn)練語料庫,構(gòu)建漏洞負(fù)載分類領(lǐng)域的細(xì)粒度分詞器;

    11、利用所述細(xì)粒度分詞器對所述漏洞負(fù)載進(jìn)行分詞;

    12、使用1個符號[cls]和多個符號[sep]對分詞進(jìn)行特殊標(biāo)記,得到編碼結(jié)果;其中,符號[cls]為句首標(biāo)識,符號[sep]為句中和句尾標(biāo)識;

    13、使用符號[mask]隨機(jī)掩蓋編碼結(jié)果中的部分詞匯。

    14、進(jìn)一步地,所述收集并構(gòu)建包括漏洞信息和負(fù)載信息的預(yù)訓(xùn)練語料庫,包括:

    15、收集并解析入侵檢測系統(tǒng)的系統(tǒng)規(guī)則信息,得到入侵檢測系統(tǒng)規(guī)則中的漏洞信息和負(fù)載信息,其中,所述入侵檢測系統(tǒng)規(guī)則中的漏洞信息包括:端口、類別和參考鏈接,所述入侵檢測系統(tǒng)規(guī)則中的負(fù)載信息包括:內(nèi)容和正則表達(dá)式;

    16、利用爬蟲收集漏洞庫的漏洞信息和負(fù)載信息;其中,所述漏洞庫的漏洞信息包括:漏洞編號、漏洞描述、漏洞類別、漏洞類別描述和漏洞評級,所述漏洞庫的負(fù)載信息包括:payload;

    17、捕獲惡意流量,利用wireshark工具包中的tshark工具提取惡意流量中的負(fù)載信息,所述惡意流量中的負(fù)載信息包括:端口和應(yīng)用層負(fù)載內(nèi)容;

    18、收集滲透測試工具的漏洞信息和負(fù)載信息,其中,所述滲透測試工具的漏洞信息包括:漏洞編號、漏洞描述、漏洞類別和漏洞類別描述,所述滲透測試工具的負(fù)載信息包括:請求、http和標(biāo)簽;

    19、綜合所述入侵檢測系統(tǒng)規(guī)則中的漏洞信息和負(fù)載信息、所述漏洞庫的漏洞信息和負(fù)載信息、所述惡意流量中的負(fù)載信息以及滲透測試工具的漏洞信息和負(fù)載信息,得到預(yù)訓(xùn)練語料庫的文本數(shù)據(jù);

    20、以漏洞編號作為連接編寫prompt提示信息,并結(jié)合語言模型,將所述預(yù)訓(xùn)練語料庫的文本數(shù)據(jù)格式化為六元組數(shù)據(jù),從而得到包括漏洞信息和負(fù)載信息的預(yù)訓(xùn)練語料庫c1;其中,所述預(yù)訓(xùn)練語料庫c1={id,description,payload,cwe_id,cwe_description,level},id代表漏洞編號,description是與漏洞描述,payload為漏洞負(fù)載,cwe_id為漏洞類別編號,cwe_description為漏洞類別描述,level為漏洞評級。

    21、進(jìn)一步地,基于所述預(yù)訓(xùn)練語料庫,構(gòu)建漏洞負(fù)載分類領(lǐng)域的細(xì)粒度分詞器,包括:

    22、創(chuàng)建一個字節(jié)對編碼分詞器,并利用所述字節(jié)對編碼分詞器獲取所述預(yù)訓(xùn)練語料庫的文本數(shù)據(jù)中的高頻詞匯和子詞,以得到詞匯表bpe_vocab;

    23、在所述預(yù)訓(xùn)練語料庫的文本數(shù)據(jù)中提取與漏洞描述和攻擊模式相關(guān)的特殊編碼詞匯,以得到詞匯表special_words;

    24、利用所述詞匯表special_words對所述預(yù)訓(xùn)練語料庫進(jìn)行單詞級別的分詞,得到詞匯表special_vocab;

    25、對所述詞匯表special_vocab中的詞匯進(jìn)行大小寫變形以及隨機(jī)重復(fù)字符的操作,得到詞匯表vul_words;

    26、針對預(yù)訓(xùn)練語料庫的負(fù)載信息,將詞匯表special_words和詞匯表vul_words中的詞匯進(jìn)行拼接,得到詞匯表concatenate_vocab;

    27、綜合所述詞匯表bpe_vocab、所述詞匯表special_words、所述詞匯表special_vocab、所述詞匯表vul_words以及所述詞匯表concatenate_vocab,得到組合詞匯表combined_vocab;

    28、構(gòu)建一分詞器,并基于所述組合詞匯表combined_vocab對該分詞器進(jìn)行訓(xùn)練,得到漏洞負(fù)載分類領(lǐng)域的細(xì)粒度分詞器。

    29、進(jìn)一步地,通過預(yù)測掩碼值得到所述漏洞負(fù)載的第一表征,包括:

    30、基于roberta預(yù)訓(xùn)練模型搭建一個模型;

    31、在所述預(yù)訓(xùn)練語料庫上,采用對抗擾動訓(xùn)練策略和掩碼任務(wù)策略對該模型進(jìn)行預(yù)訓(xùn)練,得到vulbert模型;其中,所述對抗擾動訓(xùn)練策略是利用隨機(jī)噪聲矩陣對基于預(yù)訓(xùn)練語料庫編碼生成的原始嵌入矩陣進(jìn)行對抗擾動,所述掩碼任務(wù)策略是預(yù)測預(yù)訓(xùn)練語料庫編碼的掩碼值,所述預(yù)訓(xùn)練語料庫編碼是基于預(yù)訓(xùn)練語料庫和所述細(xì)粒度分詞器生成;

    32、將掩碼后的編碼結(jié)果輸入所述vulbert模型,并提取所述vulbert模型的各層狀態(tài)值hj之后,將狀態(tài)值hj的均值作為所述漏洞負(fù)載的第一表征。

    33、進(jìn)一步地,對該模型進(jìn)行預(yù)訓(xùn)練時,損失函l_total=α·loss(f(e1),y)+β·loss(f(e1+espsilon*p),y);其中,loss是損失函數(shù),f是模型的輸出函數(shù),y是被[mask]掩碼前的原始詞,e1表示原始嵌入矩陣,espsilon表示對抗擾動參數(shù),p表示隨機(jī)噪聲矩陣,α表示第一權(quán)重參數(shù),β表示第二權(quán)重參數(shù)。

    34、進(jìn)一步地,本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種基于代碼和語義特征的漏洞負(fù)載分類方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述編碼漏洞負(fù)載,并對編碼結(jié)果進(jìn)行掩碼包括:

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述收集并構(gòu)建包括漏洞信息和負(fù)載信息的預(yù)訓(xùn)練語料庫,包括:

    4.根據(jù)權(quán)利要求3所述的方法,其特征在于,基于所述預(yù)訓(xùn)練語料庫,構(gòu)建漏洞負(fù)載分類領(lǐng)域的細(xì)粒度分詞器,包括:

    5.根據(jù)權(quán)利要求2所述的方法,其特征在于,通過預(yù)測掩碼值得到所述漏洞負(fù)載的第一表征,包括:

    6.根據(jù)權(quán)利要求5所述的方法,其特征在于,對該模型進(jìn)行預(yù)訓(xùn)練時,損失函L_total=α·Loss(f(E1),y)+β·Loss(f(E1+espsilon*P),y);其中,Loss是損失函數(shù),f是模型的輸出函數(shù),y是被[MASK]掩碼前的原始詞,E1表示原始嵌入矩陣,espsilon表示對抗擾動參數(shù),P表示隨機(jī)噪聲矩陣,α表示第一權(quán)重參數(shù),β表示第二權(quán)重參數(shù)。

    7.根據(jù)權(quán)利要求2所述的方法,其特征在于,對所述綜合表征進(jìn)行分類,得到所述漏洞負(fù)載的分類結(jié)果,包括:

    8.一種基于代碼和語義特征的漏洞負(fù)載分類系統(tǒng),其特征在于,所述系統(tǒng)包括:

    9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:處理器以及存儲有計算機(jī)程序指令的存儲器;所述處理器執(zhí)行所述計算機(jī)程序指令時實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的基于代碼和語義特征的漏洞負(fù)載分類方法。

    10.一種計算機(jī)可讀存儲介質(zhì),其特征在于,所述計算機(jī)可讀存儲介質(zhì)上存儲有計算機(jī)程序指令,所述計算機(jī)程序指令被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的基于代碼和語義特征的漏洞負(fù)載分類方法。

    ...

    【技術(shù)特征摘要】

    1.一種基于代碼和語義特征的漏洞負(fù)載分類方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述編碼漏洞負(fù)載,并對編碼結(jié)果進(jìn)行掩碼包括:

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述收集并構(gòu)建包括漏洞信息和負(fù)載信息的預(yù)訓(xùn)練語料庫,包括:

    4.根據(jù)權(quán)利要求3所述的方法,其特征在于,基于所述預(yù)訓(xùn)練語料庫,構(gòu)建漏洞負(fù)載分類領(lǐng)域的細(xì)粒度分詞器,包括:

    5.根據(jù)權(quán)利要求2所述的方法,其特征在于,通過預(yù)測掩碼值得到所述漏洞負(fù)載的第一表征,包括:

    6.根據(jù)權(quán)利要求5所述的方法,其特征在于,對該模型進(jìn)行預(yù)訓(xùn)練時,損失函l_total=α·loss(f(e1),y)+β·loss(f(e1+espsilon*p),y);其中,loss是損失函數(shù),f是模型的輸出函數(shù),y是被[m...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:王文史蓉趙法起周國橋劉峰,
    申請(專利權(quán))人:中國科學(xué)院信息工程研究所,
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 东京热一精品无码AV| 无码高潮爽到爆的喷水视频app| 国产亚洲情侣一区二区无码AV| 亚洲av无码乱码国产精品| 日韩精品无码熟人妻视频| 18禁超污无遮挡无码免费网站国产| 亚洲中文字幕久久精品无码喷水| 免费A级毛片无码免费视| 国产网红无码精品视频| 日韩视频无码日韩视频又2021| 日韩精品少妇无码受不了| 狠狠躁狠狠爱免费视频无码| 亚洲AV无码乱码在线观看代蜜桃 | 亚洲AV无码精品国产成人| 成人无码视频97免费| 激情无码亚洲一区二区三区 | 精品无码一区二区三区电影| 精品久久久久久无码人妻热| 久久久久亚洲AV无码去区首 | 久久久无码精品人妻一区| 免费无码又爽又刺激高潮视频| 九九久久精品无码专区| 国产嫖妓一区二区三区无码| 亚无码乱人伦一区二区| 无码人妻丰满熟妇区96| 免费A级毛片无码视频| 无码中文字幕日韩专区视频| 亚洲中文字幕无码一区| 中文无码成人免费视频在线观看| 无码视频在线播放一二三区| 精品无码国产AV一区二区三区| 国产成年无码久久久久下载| 久久精品日韩av无码| 国产精品午夜无码AV天美传媒| 亚洲av无码专区首页| 无码毛片一区二区三区视频免费播放| 久久久久久99av无码免费网站| 久久精品无码中文字幕| 免费一区二区无码视频在线播放 | 无码人妻精品中文字幕免费| 亚洲2022国产成人精品无码区|