System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于數(shù)據(jù)鏈網(wǎng)絡(luò),特別是涉及一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法。
技術(shù)介紹
1、數(shù)據(jù)鏈(tactical?data?link,tdl)是一種用于通信的無(wú)線通信系統(tǒng),它允許在不同平臺(tái)(例如飛機(jī)、船舶、陸地車輛等)之間共享信息和數(shù)據(jù),實(shí)現(xiàn)環(huán)境下快速可靠的信息交換。作為一種網(wǎng)絡(luò)系統(tǒng),數(shù)據(jù)鏈對(duì)著可靠性有著極高的要求,其整個(gè)系統(tǒng)的研制與測(cè)試需要廣泛而全面的評(píng)估以證明其可靠性,確保在環(huán)境中應(yīng)用的有效性。而要評(píng)估網(wǎng)絡(luò)的連接、性能瓶頸和安全性,必須向網(wǎng)絡(luò)系統(tǒng)注入真實(shí)流量。但是由于真實(shí)數(shù)據(jù)的敏感性,在系統(tǒng)未被證明可靠之前是高度保密的,這限制了系統(tǒng)研發(fā)的進(jìn)度。即使未完全研制完成的系統(tǒng)被批準(zhǔn)測(cè)試使用,組織系統(tǒng)測(cè)試需要組織協(xié)同多設(shè)備,多地區(qū)協(xié)調(diào)配合,需要耗費(fèi)大量的人力物力財(cái)力。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)在遠(yuǎn)程和多樣化的環(huán)境中進(jìn)行測(cè)試的困難,提供全面的流量分析和性能評(píng)估,本專利技術(shù)提供一種基于gai的合成流量生成框架。該框架包括一個(gè)用于表示網(wǎng)絡(luò)流量屬性的基于嵌入的模型和一個(gè)用于生成流量的條件生成對(duì)抗網(wǎng)絡(luò)(conditional?generativeadversarial?network,cgan)。
2、為了實(shí)現(xiàn)上述目的,本專利技術(shù)采用如下技術(shù)方案,一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法,整體步驟流程與輸入輸出如圖1所示,該方法包括如下步驟:
3、步驟1:流量數(shù)據(jù)準(zhǔn)備;
4、從物理網(wǎng)絡(luò)中捕獲流量數(shù)據(jù),這些數(shù)據(jù)包括網(wǎng)絡(luò)流的五元組和流量的統(tǒng)計(jì)屬性,并記錄
5、步驟2:對(duì)數(shù)據(jù)進(jìn)行上下文提取,將數(shù)據(jù)中的五元組視作一個(gè)整體進(jìn)行兩兩提取,得到提取樣本;
6、步驟3:將提取樣本嵌入改進(jìn)ip2vec模型,使其能夠根據(jù)流量中的一個(gè)元素(如源ip)預(yù)測(cè)其它元素(如目的ip或端口),捕捉流量屬性之間的關(guān)系,得到嵌入向量;
7、步驟4:構(gòu)建條件生成對(duì)抗網(wǎng)絡(luò)cgan架構(gòu)和訓(xùn)練cgan模型;
8、條件生成對(duì)抗網(wǎng)絡(luò)cgan由生成器(generator,g)和判別器(discriminator,d)兩部分組成;生成器(g)網(wǎng)絡(luò)從隨機(jī)噪聲和流量類型標(biāo)簽中生成合成流量;鑒別器(d)網(wǎng)絡(luò)區(qū)分生成的流量與真實(shí)流量;其整體的模型架構(gòu)如圖1所示;使用帶有流量類型標(biāo)簽的真實(shí)流量數(shù)據(jù)訓(xùn)練cgan模型,包括將步驟3中獲得的嵌入向量與流量的統(tǒng)計(jì)屬性結(jié)合起來(lái)作為訓(xùn)練數(shù)據(jù);通過(guò)對(duì)抗訓(xùn)練,生成器學(xué)習(xí)生成具有指定特征的流量,而鑒別器學(xué)習(xí)如何區(qū)分真實(shí)流量和生成流量;
9、步驟5:使用訓(xùn)練好的生成器網(wǎng)絡(luò),根據(jù)指定的流量類型標(biāo)簽生成合成流量;這些合成流量在統(tǒng)計(jì)上模仿真實(shí)流量的分布;將生成的合成流量的嵌入屬性映射回原始的五元組空間,添加到訓(xùn)練樣本總,進(jìn)一步用于網(wǎng)絡(luò)行為分析;通過(guò)計(jì)算合成嵌入屬性與訓(xùn)練階段存儲(chǔ)的所有嵌入結(jié)果之間的余弦相似度,找到最相似的詞匯映射回合成流量的相應(yīng)字段;
10、進(jìn)一步的,所述步驟3中首先對(duì)步驟2得到得提取向量進(jìn)行獨(dú)熱編碼,然后再輸入改進(jìn)ip2vec模型;所述改進(jìn)ip2vec模型包含:一個(gè)輸入層、一個(gè)單獨(dú)的隱藏層和一個(gè)輸出層,如圖3所示。隱藏層中的神經(jīng)元與輸入層和輸出層中的神經(jīng)元完全連接;改進(jìn)ip2vec模型的輸入層是待預(yù)測(cè)的目標(biāo)詞,輸出層是上下文詞;輸入層和輸出層分別通過(guò)一個(gè)svoc×semb和semb×svoc的權(quán)重矩陣與隱藏層連接,其中svoc表示詞庫(kù)的尺寸,semb表示word2vec模型的嵌入維度;輸出層采用softmax函數(shù)來(lái)指示輸入和輸出詞匯在相同上下文中出現(xiàn)的概率。圖3展示了當(dāng)兩個(gè)訓(xùn)練樣本(192.168.130.41,端口54981),(192.168.130.41,tcp)被輸入時(shí)網(wǎng)絡(luò)模型的狀態(tài)。給定目標(biāo)詞192.168.130.41,上下文詞是端口54981和tcp。圖3中的神經(jīng)網(wǎng)絡(luò)是使用圖2中的訓(xùn)練樣本進(jìn)行skip-gram結(jié)構(gòu)訓(xùn)練的。skip-gram的目標(biāo)是訓(xùn)練網(wǎng)絡(luò)預(yù)測(cè)詞匯表中隨機(jī)選擇的單詞是給定單詞的鄰近詞(即上下文)的概率。但是,在分類任務(wù)中不使用輸入/輸出神經(jīng)元,只提取隱藏層的權(quán)重作為詞向量。考慮到圖2生成的訓(xùn)練樣本,我們將窗口大小設(shè)為2。改進(jìn)ip2vec模型訓(xùn)練過(guò)程具體包括:
11、步驟3a:w(t)的one-hot向量表示的是進(jìn)入其中的詞-語(yǔ)境對(duì),給定一個(gè)詞w,用表示,x(t)的嵌入向量計(jì)算如下:
12、
13、其中,v是輸入詞矩陣,semb是嵌入空間的大小;
14、步驟3b:得分向量是由輸出詞矩陣乘以v(t)計(jì)算得出的,表示為
15、
16、步驟3c:然后使用softmax計(jì)算概率;上下文詞語(yǔ)的預(yù)測(cè)概率表示為:
17、
18、上下文單詞的one-hot表示向量表示為公式(4),它與預(yù)測(cè)的概率向量相匹配,swin上下文的邊界長(zhǎng)度;
19、y(t-swin),...,y(t-1),y(t+1),...y(t+swin)(4)步驟3d:考慮特征x在有c1和c2聚類的xrea和xsyn中的分布,分別表示為和表示第i個(gè)群集的平均值,表示第i個(gè)群集的分布分?jǐn)?shù);設(shè)d=[dij]為地面距離矩陣,其中dij表示和之間的地面距離;假設(shè)fij是和之間的流量,目的是找到總成本最小的流量f=[fij];
20、
21、在獲得最佳流量后,emd被定義為總流量歸一化后的功耗,如下所示:
22、
23、使用中心詞預(yù)測(cè)上下文詞語(yǔ)的概率是相互獨(dú)立的,條件概率如公式(7)所示:
24、
25、其中,aveemd表示xreal和xsyn之間所有特征的平均emd;該模型的目標(biāo)就是最小化該概率:
26、
27、其中,t是句子的長(zhǎng)度,即本文中五元組的長(zhǎng)度;利用給定的中心詞w(c)計(jì)算上下文詞w(o)的概率表示為:
28、
29、其中,vc是中心詞的詞向量,即v的第c列向量;uo是上下文詞的詞向量,即u的第o列向量,▽logp(w(o)|w(c))的計(jì)算成本與詞匯量的大小成正比。
30、進(jìn)一步的,所述訓(xùn)練時(shí)對(duì)樣本進(jìn)行有選擇的納入改進(jìn)ip2vec模型的訓(xùn)練;則:
31、目標(biāo)logp(w(o)|w(c))被替換為:
32、
33、然后,對(duì)每個(gè)目標(biāo)詞w(c)的任務(wù)進(jìn)行轉(zhuǎn)換,利用邏輯回歸將上下文詞w(o)與從噪聲分布pn(w)中抽取的k個(gè)負(fù)樣本區(qū)分開(kāi)來(lái);目標(biāo)詞的損失計(jì)算為上下文詞w(o)與k個(gè)負(fù)樣本之間的分類問(wèn)題;
34、樣本對(duì)應(yīng)的選擇概率為:
35、
36、其中,f(w)是單詞w的出現(xiàn)時(shí)間,pn(w)是選擇單詞w作為負(fù)樣本的概率。
37、進(jìn)一步的,所述步驟4中使用的生成器的輸入由兩個(gè)部分組成,其第一個(gè)部分由是先驗(yàn)噪聲pz(z),其作用是增加生成樣本的多樣性;由于噪聲向量是隨機(jī)生成的,每本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法,該方法包括如下步驟:
2.如權(quán)利要求1所述的一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法,其特征在于,所述步驟3中首先對(duì)步驟2得到得提取向量進(jìn)行獨(dú)熱編碼,然后再輸入改進(jìn)IP2Vec模型;所述改進(jìn)IP2Vec模型包含:一個(gè)輸入層、一個(gè)單獨(dú)的隱藏層和一個(gè)輸出層,隱藏層中的神經(jīng)元與輸入層和輸出層中的神經(jīng)元完全連接;改進(jìn)IP2Vec模型的輸入層是待預(yù)測(cè)的目標(biāo)詞,輸出層是上下文詞;輸入層和輸出層分別通過(guò)一個(gè)svoc×semb和semb×svoc的權(quán)重矩陣與隱藏層連接,其中svoc表示詞庫(kù)的尺寸,semb表示W(wǎng)ord2Vec模型的嵌入維度;輸出層采用Softmax函數(shù)來(lái)指示輸入和輸出詞匯在相同上下文中出現(xiàn)的概率;改進(jìn)IP2Vec模型訓(xùn)練過(guò)程具體包括:
3.如權(quán)利要求1所述的一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法,其特征在于,所述步驟4中使用的生成器的輸入由兩個(gè)部分組成,其第一個(gè)部分由是先驗(yàn)噪聲pz(z);第二個(gè)部分是流量的應(yīng)用類型;
4.如權(quán)利要求1所述的一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法,
5.如權(quán)利要求2所述的一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法,其特征在于,所述訓(xùn)練時(shí)對(duì)樣本進(jìn)行有選擇的納入改進(jìn)IP2Vec模型的訓(xùn)練;則:
...【技術(shù)特征摘要】
1.一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法,該方法包括如下步驟:
2.如權(quán)利要求1所述的一種基于生成對(duì)抗網(wǎng)絡(luò)的數(shù)據(jù)鏈網(wǎng)絡(luò)流量生成方法,其特征在于,所述步驟3中首先對(duì)步驟2得到得提取向量進(jìn)行獨(dú)熱編碼,然后再輸入改進(jìn)ip2vec模型;所述改進(jìn)ip2vec模型包含:一個(gè)輸入層、一個(gè)單獨(dú)的隱藏層和一個(gè)輸出層,隱藏層中的神經(jīng)元與輸入層和輸出層中的神經(jīng)元完全連接;改進(jìn)ip2vec模型的輸入層是待預(yù)測(cè)的目標(biāo)詞,輸出層是上下文詞;輸入層和輸出層分別通過(guò)一個(gè)svoc×semb和semb×svoc的權(quán)重矩陣與隱藏層連接,其中svoc表示詞庫(kù)的尺寸,semb表示word2vec模型的嵌入維度...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:蔣定德,黃子宸,何一鳴,王志浩,
申請(qǐng)(專利權(quán))人:電子科技大學(xué),
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。