System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及網絡安全,特別涉及一種數據檢測方法、分類器訓練方法及相關設備。
技術介紹
1、隨著信息化產業的高速全面發展,互聯網的普及和企業網絡的廣泛應用,網絡安全領域的漏洞和威脅也呈現出增長趨勢,傳統的防火墻等便捷防護措施已經不足以應對復雜的內部和外部威脅,難以準確檢測出網絡中的異常流量,如惡意流量等。
2、鑒于此,如何提高檢測異常流量的準確性,是亟需解決的問題。
技術實現思路
1、本申請提供一種數據檢測方法、分類器訓練方法及相關設備,用于提高檢測異常流量的準確性。
2、第一方面,本申請實施例提供了一種數據檢測方法,應用于任何具備處理能力的電子設備,該方法包括:
3、將待檢測流量的多個特征輸入到第一分類器中,通過第一分類器對多個特征進行處理,輸出待檢測流量的第一權重;
4、計算第一權重和預設的標準權重之間的差距,基于該差距確定第一權重的可信度;
5、若可信度不小于閾值,則基于第一權重確定待檢測流量是否為異常流量;
6、若可信度小于閾值,則將多個特征輸入到第二分類器中,通過第二分類器對多個特征進行處理,輸出待檢測流量的第二權重;基于第一權重和第二權重確定待檢測流量是否為異常流量;
7、其中,第一分類器和第二分類器為不同的分類器;第一權重和第二權重用于指示待檢測流量是否異常。
8、在本方案中,通過第一分類器對待檢測流量的多個特征進行處理,得到第一權重后,基于第一權重和預設的標準權重之間的差距來
9、可選的,第一分類器為極限學習機,計算第一權重和預設的標準權重之間的差距,基于該差距確定第一權重的可信度,包括:
10、基于如下公式計算第一權重和預設的標準權重之間的歸一化距離,將該歸一化距離作為第一權重的可信度:
11、ywd=exp(-││x0│-│w││);
12、其中,ywd表示可信度,x0表示待檢測流量的第一權重,w表示預設的標準權重;exp(-││x0│-│w││)表示計算待檢測流量的第一權重的絕對值與預設的標準權重的絕對值之間的距離的指數。
13、可選的,若可信度不小于預設閾值,基于第一權重確定待檢測流量是否為異常流量,包括:在ywd小于預設閾值的情況下,若x0不小于0,則確定待檢測流量為異常流量,且x0越接近于w的絕對值,表示待檢測流量的異常程度越大;若x0小于0,則確定待檢測流量為正常流量。
14、可選的,第二分類器包括多個子分類器;通過第二分類器對多個特征進行處理,輸出待檢測流量的第二權重,包括:通過多個子分類器中的每個子分類器對多個特征進行識別和預測,得到多個子分類器對待檢測流量的多個預測結果;預測結果包括待檢測流量的流量類型,流量類型包括正常流量和異常流量;根據多個預測結果統計每種流量類型出現的數量,基于出現的數量最大的流量類型確定第二權重;
15、基于第一權重和第二權重確定待檢測流量是否為異常流量,包括:若第一權重不小于0,且第二權重用于指示待檢測流量為異常流量,則確定待檢測流量為異常流量;否則,確定待檢測流量為正常流量。
16、可選的,第二分類器為與第一分類器的參數不同的極限學習機;通過第二分類器對多個特征進行處理,輸出待檢測流量的第二權重,包括:通過第二分類器對多個特征中的每個特征進行識別,并預測每個特征分別為異常特征和正常特征的概率;加權計算每個特征的概率得到第二權重;
17、基于第一權重和第二權重確定待檢測流量是否為異常流量,包括:若第一權重不小于0,且第二權重也不小于0,則確定所述待檢測流量為異常流量;否則,確定所述待檢測流量為正常流量。
18、可選的,基于第一權重和第二權重確定待檢測流量是否為異常流量,還包括:若第一權重的可信度小于第一閾值,則基于第二權重確定待檢測流量是否為異常流量;第一閾值小于預設閾值。
19、第二方面,本申請實施例提供了一種分類器訓練方法,可以應用于任何具備處理能力的電子設備,包括:
20、將第一訓練集中的每個樣本流量的多個特征輸入到第一分類器中,通過第一分類器對每個樣本流量的多個特征進行處理,輸出每個樣本流量的第三權重;
21、計算每個樣本流量的第三權重與預設的標準權重中之間的差距,基于該差距確定第三權重的可信度;
22、獲取第三權重的可信度小于預設閾值的至少一個樣本流量;將該至少一個樣本流量中每個樣本流量的多個特征以及每個樣本流量的真實流量類型輸入到第二分類器中,通過第二分類器對每個樣本流量的多個特征進行處理輸出每個樣本流量的第四權重;基于每個樣本流量的第四權重確定每個樣本流量的流量類型,流量類型包括正常流量和異常流量;
23、計算每個樣本流量的流量類型和每個樣本流量的真實流量類型的第一損失值,以第一損失值小于第二閾值為目標,調整第二分類器的參數,得到訓練好的第二分類器;
24、其中,第一分類器和第二分類器為不同的分類器,第三權重和第四權重均用于指示每個樣本流量是否異常。
25、在本方案中,基于第一分類器輸出的可信度低于預設閾值的至少一個流量樣本作為第二分類器的訓練樣本,使得訓練好的第二分類器可以對第一分類器無法準確識別的待檢測流量進行更為準確的識別和預測,對待檢測流量的識別更加全面,進而提高檢測異常流量的準確性。
26、可選的,第一分類器為極限學習機,計算每個樣本流量的第三權重和預設的標準權重之間的差距,基于該差距確定第三權重的可信度,包括:基于如下公式計算第三權重和預設的標準權重之間的歸一化距離,將該歸一化距離作為第三權重的可信度:
27、ywd=exp(-││xi│-│w││);
28、其中,ywd表示可信度,xi表示第i個樣本流量的第三權重,w表示預設的標準權重;exp(-││xi│-│w││)表示計算第i個樣本流量的第三權重的絕對值與預設的標準權重的絕對值之間的距離的指數。
29、可選的,在將第一訓練集中的每個樣本流量的多個特征輸入到第一分類器之前,方法還包括:將第二訓練集中每個樣本流量的多個特征輸入到第一分類器中,通過第一分類器對每個樣本流量的多個特征進行處理,輸出每個樣本流量的第五權重;基于每個樣本流量的第五權重確定每個樣本流量的流量類型;基于每個樣本流量的流量類型和每個樣本流量的真實類型計算第二損失值,以第二損失值小于第三閾值為目的,調整第一本文檔來自技高網...
【技術保護點】
1.一種數據檢測方法,其特征在于,包括:
2.如權利要求1所述的方法,其特征在于,所述第一分類器為極限學習機,所述計算所述第一權重和預設的標準權重之間的差距,基于所述差距確定所述第一權重的可信度,包括:
3.如權利要求2所述的方法,其特征在于,所述若所述可信度不小于預設閾值,則基于所述第一權重確定所述待檢測流量是否為異常流量,包括:
4.如權利要求2所述的方法,其特征在于,所述第二分類器包括多個子分類器;所述通過所述第二分類器對所述多個特征進行處理,輸出所述待檢測流量的第二權重,包括:
5.如權利要求2所述的方法,其特征在于,所述第二分類器為與所述第一分類器的參數不同的極限學習機;所述通過所述第二分類器對所述多個特征進行處理,輸出所述待檢測流量的第二權重,包括:
6.如權利要求1所述的方法,其特征在于,所述基于所述第一權重和所述第二權重確定所述待檢測流量是否為異常流量,包括:
7.一種分類器訓練方法,其特征在于,包括:
8.如權利要求7所述的方法,其特征在于,所述第一分類器為極限學習機,所述計算所
9.如權利要求7所述的方法,其特征在于,在將第一訓練集中每個樣本流量的多個特征輸入到第一分類器中之前,所述方法還包括:
10.如權利要求7所述的方法,其特征在于,在將第一訓練集中每個樣本流量的多個特征輸入到第一分類器中之前,所述方法還包括:
11.一種數據檢測裝置,其特征在于,包括:
12.一種分類器訓練裝置,其特征在于,包括:
13.一種電子設備,其特征在于,包括:
14.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質用于有計算機程序,所述計算機程序包括程序指令,當所述程序指令被計算機執行時,使如權利要求1-6任一項所述的方法或7-10任一項所述的方法被實現。
...【技術特征摘要】
1.一種數據檢測方法,其特征在于,包括:
2.如權利要求1所述的方法,其特征在于,所述第一分類器為極限學習機,所述計算所述第一權重和預設的標準權重之間的差距,基于所述差距確定所述第一權重的可信度,包括:
3.如權利要求2所述的方法,其特征在于,所述若所述可信度不小于預設閾值,則基于所述第一權重確定所述待檢測流量是否為異常流量,包括:
4.如權利要求2所述的方法,其特征在于,所述第二分類器包括多個子分類器;所述通過所述第二分類器對所述多個特征進行處理,輸出所述待檢測流量的第二權重,包括:
5.如權利要求2所述的方法,其特征在于,所述第二分類器為與所述第一分類器的參數不同的極限學習機;所述通過所述第二分類器對所述多個特征進行處理,輸出所述待檢測流量的第二權重,包括:
6.如權利要求1所述的方法,其特征在于,所述基于所述第一權重和所述第二權重確定所述待檢測流量是否為異常流量,包括:
7.一種分類...
【專利技術屬性】
技術研發人員:全宇軒,郭雅琨,葉志丹,
申請(專利權)人:天翼安全科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。