System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)屬于數(shù)據(jù)監(jiān)督檢測領(lǐng)域,尤其涉及一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法。
技術(shù)介紹
1、入侵檢測系統(tǒng)(intrusion?detection?system,ids)是網(wǎng)絡(luò)安全領(lǐng)域中的一項主動防御技術(shù)。ids通過收集和分析來自網(wǎng)絡(luò)流量、系統(tǒng)日志和應(yīng)用程序數(shù)據(jù)的信息,能夠識別出已知的攻擊模式、異常行為或未授權(quán)的活動。有效的ids能夠及時警報管理員,并提供有關(guān)威脅的詳細(xì)信息,以便迅速采取應(yīng)對措施,從而降低安全風(fēng)險和潛在損失。過去幾十年里,許多研究采取的是將傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)相結(jié)合的方法應(yīng)用到ids中去。
2、但是,在網(wǎng)絡(luò)入侵檢測中,數(shù)據(jù)集通常是類不平衡的,良性樣本(即多數(shù)類)的數(shù)量遠(yuǎn)多于惡意樣本(即少數(shù)類)。由于惡意樣本的稀缺性及其被誤判會帶來的嚴(yán)重后果,因此準(zhǔn)確檢測這些少數(shù)類樣本變得至關(guān)重要。然而,類不平衡的數(shù)據(jù)集給檢測分類器的訓(xùn)練帶來了挑戰(zhàn),可能會導(dǎo)致少數(shù)類樣本被誤判或忽略,從而降低了少數(shù)類分類的準(zhǔn)確性。因此,加強少數(shù)類樣本的分類能力,提高整體分類準(zhǔn)確率,是入侵檢測系統(tǒng)面臨的重要挑戰(zhàn)。
技術(shù)實現(xiàn)思路
1、有鑒于現(xiàn)有技術(shù)的上述缺陷,本專利技術(shù)提出一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,本專利技術(shù)設(shè)計的技術(shù)方案步驟包括:
2、s10:基于數(shù)值類型對入侵檢測數(shù)據(jù)集進行預(yù)處理,得到真實樣本;
3、s20:訓(xùn)練deepgan采樣模型;
4、s30:輸出采樣結(jié)果并基于檢測模型對采樣結(jié)果進行異常檢測。
5、
6、所述入侵檢測數(shù)據(jù)集包括數(shù)值型數(shù)據(jù)和非數(shù)值型數(shù)據(jù);
7、對數(shù)值型數(shù)據(jù)進行縮放處理,公式如下:
8、
9、式中,x為數(shù)值型數(shù)據(jù)的特征值,x′為標(biāo)準(zhǔn)化后數(shù)值型數(shù)據(jù)的特征值,xmax為數(shù)值型數(shù)據(jù)的特征最大值,xmin為數(shù)值型數(shù)據(jù)的特征最小值;
10、對每一列非數(shù)值型數(shù)據(jù)采用one-hot編碼處理。
11、優(yōu)選地,所述s10還包括:
12、劃分入侵檢測數(shù)據(jù)集,將入侵檢測數(shù)據(jù)集的70%數(shù)據(jù)量劃分為訓(xùn)練數(shù)據(jù)集,將剩余30%數(shù)據(jù)量的入侵檢測數(shù)據(jù)集劃分為測試數(shù)據(jù)集,得到訓(xùn)練數(shù)據(jù)集的真實樣本和測試數(shù)據(jù)集的真實樣本。
13、優(yōu)選地,所述s10還包括:
14、計算訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集各自的不平衡率,公式如下:
15、
16、式中,ir為不平衡率,nmajority為多數(shù)類數(shù)量,nminority為少數(shù)類數(shù)量;
17、基于訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集各自的不平衡率生成(nmajority-nminority)個少數(shù)類樣本。
18、優(yōu)選地,所述deepgan采樣模型包括:
19、生成器、判別器、輔助分類器和信息提取模塊;
20、所述生成器用于輸入真實樣本輸出生成樣本;
21、所述判別器用于區(qū)分真實樣本和生成樣本;
22、所述輔助分類器用于預(yù)測給定樣本的類別標(biāo)簽并將生成樣本對應(yīng)到給定樣本的類別標(biāo)簽中;
23、所述信息提取模塊用于對生成器、判別器的以及輔助分類器的隱藏層輸出進行特征處理。
24、優(yōu)選地,所述s20包括以下步驟:
25、s2001:固定判別器訓(xùn)練生成器,生成器通過最小化判別器對生成樣本的判斷誤差,調(diào)整生成器的權(quán)重;
26、s2002:固定生成器訓(xùn)練判別器,判別器通過最小化真實樣本和生成樣本之間的wasserstein距離,調(diào)整判別器的權(quán)重;
27、s2003:將輔助分類器的損失添加至生成器的損失中,預(yù)測給定樣本的類別標(biāo)簽,將生成樣本對應(yīng)到給定樣本的類別標(biāo)簽;
28、s2004:生成器損失和判別器損失通過反向傳播不斷優(yōu)化和調(diào)整各自的權(quán)重,至判別器無法判斷真實樣本的來源時,完成deepgan采樣模型的訓(xùn)練。
29、優(yōu)選地,所述生成器用于輸入真實樣本輸出生成樣本包括:
30、生成器輸入30維的隨機噪聲z以及類別標(biāo)簽y,經(jīng)過隱藏層進行特征提取,通過信息提取模塊在隱藏層提取的特征基礎(chǔ)上進一步提取時間之間的依賴關(guān)系,提取后的數(shù)據(jù)結(jié)果被用作后續(xù)輸出層的輸入;
31、在輸出層中,生成器依據(jù)數(shù)值類型分為數(shù)值向量和非數(shù)值向量;對于數(shù)值向量輸出,生成器通過線性層直接產(chǎn)生數(shù)值輸出;對于非數(shù)值向量輸出,生成器為每一個非數(shù)值列設(shè)置單獨的密集層,使每一個非數(shù)值列能夠產(chǎn)生獨立的輸出;將數(shù)值向量輸出和非數(shù)值向量輸出進行拼接輸出一個完整的生成樣本。
32、優(yōu)選地,所述密集層采用gumbel-softmax激活函數(shù),將來自gumbel分布的噪聲添加到非數(shù)值向量輸出中,對于表示k個類別非數(shù)值向量的非歸一化對數(shù)概率的向量x,gumbel-softmax被應(yīng)用于向量x的每個元素xi,公式如下:
33、
34、式中,g1,…,gk為從gumbel(0,1)中抽取的獨立同分布樣本,τ是溫度系數(shù)。
35、優(yōu)選地,所述判別器用于區(qū)分真實樣本和生成樣本包括:
36、判別器輸入為類別標(biāo)簽y和生成樣本,根據(jù)生成樣本的數(shù)值類型進行分類處理;對于數(shù)值向量,判別器添加均值為0的高斯噪聲,表示數(shù)據(jù)樣本的m個數(shù)值向量x,將噪聲添加到每個向量xi,使得其中z1,z2...zm從n(0,0.01)獲得,將噪聲分別添加到真實樣本和生成樣本中;對于非數(shù)值向量,將非數(shù)值向量通過單獨的嵌入層進行降維處理,維度根據(jù)one-hot的原始維度k進行動態(tài)調(diào)整至維度d,維度d=min([k/3],20);
37、將數(shù)值向量和非數(shù)值向量共同作為判別器隱藏層的輸入,基于非線性變換學(xué)習(xí)數(shù)值向量和非數(shù)值向量,并通過信息提取模塊整合全局信息提取出區(qū)分真實樣本和生成樣本的特征,輸出層輸出真實樣本和生成樣本之間的wasserstein距離。
38、優(yōu)選地,所述信息提取模塊用于對生成器、判別器的以及輔助分類器的隱藏層輸出進行特征處理包括:
39、所述信息提取模塊包括位置編碼器與transformer編碼器,應(yīng)用在生成器、判別器的以及輔助分類器的隱藏層之后,輸入信息提取模塊的數(shù)據(jù)通過多組權(quán)重矩陣wq,wk和wv進行線性變化,生成查詢向量q、鍵向量k和值向量v,通過q和kt的點積計算,計算不同特征之間的相似性關(guān)系;
40、所述q和kt的點積計算公式如下:
41、
42、有益效果:本專利技術(shù)提出一種深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,針對數(shù)據(jù)類不平衡導(dǎo)致檢測器性能下降的問題,利用現(xiàn)有的過采樣方法,設(shè)計基于深度生成式對抗式網(wǎng)絡(luò)的過采樣方法,引入基于transformer的信息提取模塊來幫助模型提取全局信息,以充分地學(xué)習(xí)少數(shù)類數(shù)據(jù)的分布特征,并考慮到入侵檢測數(shù)據(jù)集中同時包含數(shù)值變量和非數(shù)值變量,采取差異化的處理策略,以確保模型能夠同時有效地對這兩種類型的變量進行建模,最后,將wgan-gp和cgan的損失函數(shù)結(jié)合本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述S10包括:
3.根據(jù)權(quán)利要求1所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述S10還包括:
4.根據(jù)權(quán)利要求3所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述S10還包括:
5.根據(jù)權(quán)利要求2所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述DeepGAN采樣模型包括:
6.根據(jù)權(quán)利要求5所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述S20包括以下步驟:
7.根據(jù)權(quán)利要求5所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述生成器用于輸入真實樣本輸出生成樣本包括:
8.根據(jù)權(quán)利要求7所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述密集層采用Gumbel-Softmax激活函數(shù),將來自Gu
9.根據(jù)權(quán)利要求5所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述判別器用于區(qū)分真實樣本和生成樣本包括:
10.根據(jù)權(quán)利要求5所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述信息提取模塊用于對生成器、判別器的以及輔助分類器的隱藏層輸出進行特征處理包括:
...【技術(shù)特征摘要】
1.一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述s10包括:
3.根據(jù)權(quán)利要求1所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述s10還包括:
4.根據(jù)權(quán)利要求3所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述s10還包括:
5.根據(jù)權(quán)利要求2所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述deepgan采樣模型包括:
6.根據(jù)權(quán)利要求5所述的一種基于深度生成對抗網(wǎng)絡(luò)的工業(yè)互聯(lián)網(wǎng)異常檢測方法,其特征在于,所述s20包括以下步驟:
7.根據(jù)權(quán)利要求5所述的一種基于深度生成...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:尚文利,丁磊,浣沙,黃梓峰,曹忠,張曼,周正,高曉斌,
申請(專利權(quán))人:廣州大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。