System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)涉及信息安全領(lǐng)域,特別涉及一種未知樣本分類(lèi)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、目前,安全檢測(cè)產(chǎn)品被用來(lái)鑒別某一個(gè)未知文件是否會(huì)對(duì)電腦系統(tǒng)造成危害,即需要具有對(duì)未知文件進(jìn)行判別的能力。鑒定的危險(xiǎn)等級(jí)越高,意味著該文件執(zhí)行后,對(duì)電腦系統(tǒng)造成的危害就越大。如今的安全檢測(cè)產(chǎn)品通常基于多維特征,對(duì)文件進(jìn)行檢測(cè)。通常可以歸類(lèi)為以下兩種:
2、方法1:為未知樣本的多維特征中的每個(gè)特征賦予一個(gè)代表危險(xiǎn)程度的權(quán)值,然后進(jìn)行權(quán)值累加等計(jì)算得到樣本得分,之后再與基于已知的安全樣本與惡意樣本所得到的閾值進(jìn)行比較。這種方法可以緩解部分問(wèn)題,但是調(diào)整權(quán)重和分?jǐn)?shù)是一件及其復(fù)雜的過(guò)程,極大的耗費(fèi)人工方法,且即便不是簡(jiǎn)單的做和而是更復(fù)雜的數(shù)學(xué)模型但通常都無(wú)法保證最終結(jié)果對(duì)于樣本分析人員的可解釋性,或者無(wú)法完全解決上面的問(wèn)題。
3、方法2:基于已知安全樣本與惡意樣本的多維特征,進(jìn)行機(jī)器學(xué)習(xí),得到機(jī)器學(xué)習(xí)模型;然后利用機(jī)器學(xué)習(xí)模型,來(lái)對(duì)未知樣本進(jìn)行檢測(cè)。由于機(jī)器學(xué)習(xí)的固有問(wèn)題,該方法同樣具有不可解釋性的問(wèn)題,且機(jī)器學(xué)習(xí)的效果嚴(yán)重依賴(lài)于訓(xùn)練過(guò)程中樣本集的質(zhì)量,出現(xiàn)新類(lèi)型的特征時(shí)需要重新訓(xùn)練模型。
4、因此,如何準(zhǔn)確地實(shí)現(xiàn)未知樣本分類(lèi),并提高分類(lèi)結(jié)果對(duì)于樣本分析人員的可解釋性是當(dāng)前領(lǐng)域內(nèi)技術(shù)人員亟待解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本專(zhuān)利技術(shù)的目的在于提供一種未知樣本分類(lèi)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),能夠有效提高未知樣本分類(lèi)的效率以及準(zhǔn)確性,并提高作為分類(lèi)結(jié)果的目
2、第一方面,本申請(qǐng)?zhí)峁┝艘环N未知樣本分類(lèi)方法,包括:
3、獲取與待分類(lèi)的未知樣本的多維特征對(duì)應(yīng)的特征權(quán)值集合,以得到分別與所述多維特征中的各個(gè)特征對(duì)應(yīng)的特征權(quán)值;
4、基于各所述特征權(quán)值以及預(yù)設(shè)權(quán)值等級(jí)信息得到與所述未知樣本對(duì)應(yīng)的特征權(quán)值分級(jí)信息,并通過(guò)對(duì)各所述特征權(quán)值進(jìn)行累加,得到與所述未知樣本對(duì)應(yīng)的初始樣本分類(lèi)等級(jí)信息;
5、通過(guò)所述特征權(quán)值分級(jí)信息并分別基于相應(yīng)的相變閾值集合、躍遷相變閾值集合以及下限相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本分別對(duì)應(yīng)的第一上限分類(lèi)等級(jí)信息、第二上限分類(lèi)等級(jí)信息以及目標(biāo)下限分類(lèi)等級(jí)信息;
6、基于預(yù)設(shè)等級(jí)判定規(guī)則以及所述初始樣本分類(lèi)等級(jí)信息、所述第一上限分類(lèi)等級(jí)信息、所述第二上限分類(lèi)等級(jí)信息以及所述目標(biāo)下限分類(lèi)等級(jí)信息,確定與所述未知樣本對(duì)應(yīng)的目標(biāo)分類(lèi)等級(jí)。
7、可選的,所述基于各所述特征權(quán)值以及預(yù)設(shè)權(quán)值等級(jí)信息得到與所述未知樣本對(duì)應(yīng)的特征權(quán)值分級(jí)信息,并通過(guò)對(duì)各所述特征權(quán)值進(jìn)行累加,得到與所述未知樣本對(duì)應(yīng)的初始樣本分類(lèi)等級(jí)信息,包括:
8、獲取預(yù)設(shè)權(quán)值等級(jí)信息;其中,所述預(yù)設(shè)權(quán)值等級(jí)信息包括相應(yīng)的若干個(gè)權(quán)重等級(jí)以及與各所述權(quán)重等級(jí)分別對(duì)應(yīng)的目標(biāo)權(quán)值與特征危險(xiǎn)程度信息;
9、基于所述預(yù)設(shè)權(quán)值等級(jí)信息以及各所述特征權(quán)值確定所述未知樣本的所述多維特征中的各個(gè)所述特征的特征等級(jí)信息;
10、基于各所述特征等級(jí)信息統(tǒng)計(jì)各個(gè)所述權(quán)重等級(jí)的特征數(shù)量,以得到與所述未知樣本對(duì)應(yīng)的特征權(quán)值分級(jí)信息;
11、通過(guò)對(duì)各所述特征權(quán)值進(jìn)行累加得到與所述未知樣本對(duì)應(yīng)的樣本分值;
12、獲取預(yù)設(shè)樣本等級(jí)信息,并基于所述預(yù)設(shè)樣本等級(jí)信息以及所述樣本分值得到與所述未知樣本對(duì)應(yīng)的初始樣本分類(lèi)等級(jí)信息;其中,所述預(yù)設(shè)樣本等級(jí)信息包括相應(yīng)的若干個(gè)樣本等級(jí)以及與各所述樣本等級(jí)分別對(duì)應(yīng)的分值閾值與樣本危險(xiǎn)程度信息。
13、可選的,通過(guò)所述特征權(quán)值分級(jí)信息并基于相應(yīng)的相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本對(duì)應(yīng)的第一上限分類(lèi)等級(jí)信息,包括:
14、獲取預(yù)先設(shè)定的與所述未知樣本對(duì)應(yīng)的相變閾值集合;
15、針對(duì)所述特征權(quán)值分級(jí)信息中以等級(jí)從低到高的方式順序排列的各個(gè)元素,依次獲取所述相變閾值集合中對(duì)應(yīng)的相變閾值;
16、判斷所述特征權(quán)值分級(jí)信息中的各所述元素是否大于等于對(duì)應(yīng)的所述相變閾值,分別得到對(duì)應(yīng)的第一判斷結(jié)果;
17、基于各所述第一判斷結(jié)果以及第一預(yù)設(shè)公式,確定與所述未知樣本對(duì)應(yīng)的第一上限分類(lèi)等級(jí)信息。
18、可選的,通過(guò)所述特征權(quán)值分級(jí)信息并基于相應(yīng)的躍遷相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本對(duì)應(yīng)的第二上限分類(lèi)等級(jí)信息,包括:
19、獲取預(yù)先設(shè)定的與所述未知樣本對(duì)應(yīng)的躍遷相變閾值集合以及躍遷跨度;
20、針對(duì)所述特征權(quán)值分級(jí)信息中以等級(jí)從低到高的方式順序排列的各個(gè)元素,依次獲取所述躍遷相變閾值集合中對(duì)應(yīng)的躍遷相變閾值;
21、判斷所述特征權(quán)值分級(jí)信息中的各所述元素是否大于等于對(duì)應(yīng)的所述躍遷相變閾值,分別得到對(duì)應(yīng)的第二判斷結(jié)果;
22、基于各所述第二判斷結(jié)果、所述躍遷跨度以及第二預(yù)設(shè)公式,確定與所述未知樣本對(duì)應(yīng)的第二上限分類(lèi)等級(jí)信息。
23、可選的,通過(guò)所述特征權(quán)值分級(jí)信息并基于相應(yīng)的下限相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本對(duì)應(yīng)的目標(biāo)下限分類(lèi)等級(jí)信息,包括:
24、獲取預(yù)先設(shè)定的與所述未知樣本對(duì)應(yīng)的下限相變閾值集合以及下限跨度;
25、針對(duì)所述特征權(quán)值分級(jí)信息中以等級(jí)從低到高的方式順序排列的各個(gè)元素,依次獲取所述下限相變閾值集合中對(duì)應(yīng)的下限相變閾值;
26、判斷所述特征權(quán)值分級(jí)信息中的各所述元素是否大于等于對(duì)應(yīng)的所述下限相變閾值,分別得到對(duì)應(yīng)的第三判斷結(jié)果;
27、基于各所述第三判斷結(jié)果、所述下限跨度以及第三預(yù)設(shè)公式,確定與所述未知樣本對(duì)應(yīng)的目標(biāo)下限分類(lèi)等級(jí)信息。
28、可選的,所述基于預(yù)設(shè)等級(jí)判定規(guī)則以及所述初始樣本分類(lèi)等級(jí)信息、所述第一上限分類(lèi)等級(jí)信息、所述第二上限分類(lèi)等級(jí)信息以及所述目標(biāo)下限分類(lèi)等級(jí)信息,確定與所述未知樣本對(duì)應(yīng)的目標(biāo)分類(lèi)等級(jí),包括:
29、通過(guò)對(duì)所述第一上限分類(lèi)等級(jí)信息以及所述第二上限分類(lèi)等級(jí)信息進(jìn)行對(duì)比,得到對(duì)應(yīng)的第一對(duì)比結(jié)果;
30、基于所述第一對(duì)比結(jié)果確定與所述未知樣本對(duì)應(yīng)的目標(biāo)上限分類(lèi)等級(jí)信息;
31、通過(guò)對(duì)比所述初始樣本分類(lèi)等級(jí)信息以及所述目標(biāo)上限分類(lèi)等級(jí)信息,得到對(duì)應(yīng)的第二對(duì)比結(jié)果;
32、基于所述第二對(duì)比結(jié)果以及所述目標(biāo)下限分類(lèi)等級(jí)信息,確定與所述未知樣本對(duì)應(yīng)的目標(biāo)分類(lèi)等級(jí)。
33、第二方面,本申請(qǐng)?zhí)峁┝艘环N未知樣本分類(lèi)裝置,包括:
34、特征權(quán)值獲取模塊,用于獲取與待分類(lèi)的未知樣本的多維特征對(duì)應(yīng)的特征權(quán)值集合,以得到分別與所述多維特征中的各個(gè)特征對(duì)應(yīng)的特征權(quán)值;
35、初始等級(jí)獲取模塊,用于基于各所述特征權(quán)值以及預(yù)設(shè)權(quán)值等級(jí)信息得到與所述未知樣本對(duì)應(yīng)的特征權(quán)值分級(jí)信息,并通過(guò)對(duì)各所述特征權(quán)值進(jìn)行累加,得到與所述未知樣本對(duì)應(yīng)的初始樣本分類(lèi)等級(jí)信息;
36、閾值集合計(jì)算模塊,用于通過(guò)所述特征權(quán)值分級(jí)信息并分別基于相應(yīng)的相變閾本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種未知樣本分類(lèi)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的未知樣本分類(lèi)方法,其特征在于,所述基于各所述特征權(quán)值以及預(yù)設(shè)權(quán)值等級(jí)信息得到與所述未知樣本對(duì)應(yīng)的特征權(quán)值分級(jí)信息,并通過(guò)對(duì)各所述特征權(quán)值進(jìn)行累加,得到與所述未知樣本對(duì)應(yīng)的初始樣本分類(lèi)等級(jí)信息,包括:
3.根據(jù)權(quán)利要求1所述的未知樣本分類(lèi)方法,其特征在于,通過(guò)所述特征權(quán)值分級(jí)信息并基于相應(yīng)的相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本對(duì)應(yīng)的第一上限分類(lèi)等級(jí)信息,包括:
4.根據(jù)權(quán)利要求1所述的未知樣本分類(lèi)方法,其特征在于,通過(guò)所述特征權(quán)值分級(jí)信息并基于相應(yīng)的躍遷相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本對(duì)應(yīng)的第二上限分類(lèi)等級(jí)信息,包括:
5.根據(jù)權(quán)利要求1所述的未知樣本分類(lèi)方法,其特征在于,通過(guò)所述特征權(quán)值分級(jí)信息并基于相應(yīng)的下限相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本對(duì)應(yīng)的目標(biāo)下限分類(lèi)等級(jí)信息,包括:
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的未知樣本分類(lèi)方法,其特征在于,所述基于預(yù)設(shè)等級(jí)判定規(guī)則以及所述初始樣本分類(lèi)等級(jí)信息、所述第一上限分類(lèi)等級(jí)信息、所
7.一種未知樣本分類(lèi)裝置,其特征在于,包括:
8.根據(jù)權(quán)利要求7所述的未知樣本分類(lèi)裝置,其特征在于,所述初始等級(jí)獲取模塊,包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,用于保存計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6任一項(xiàng)所述的未知樣本分類(lèi)方法。
...【技術(shù)特征摘要】
1.一種未知樣本分類(lèi)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的未知樣本分類(lèi)方法,其特征在于,所述基于各所述特征權(quán)值以及預(yù)設(shè)權(quán)值等級(jí)信息得到與所述未知樣本對(duì)應(yīng)的特征權(quán)值分級(jí)信息,并通過(guò)對(duì)各所述特征權(quán)值進(jìn)行累加,得到與所述未知樣本對(duì)應(yīng)的初始樣本分類(lèi)等級(jí)信息,包括:
3.根據(jù)權(quán)利要求1所述的未知樣本分類(lèi)方法,其特征在于,通過(guò)所述特征權(quán)值分級(jí)信息并基于相應(yīng)的相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本對(duì)應(yīng)的第一上限分類(lèi)等級(jí)信息,包括:
4.根據(jù)權(quán)利要求1所述的未知樣本分類(lèi)方法,其特征在于,通過(guò)所述特征權(quán)值分級(jí)信息并基于相應(yīng)的躍遷相變閾值集合進(jìn)行相應(yīng)計(jì)算,得到與所述未知樣本對(duì)應(yīng)的第二上限分類(lèi)等級(jí)信息,包括:
5.根據(jù)權(quán)利要求1所述的未知樣本分類(lèi)方法,其特征在于,通過(guò)所述...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:王天博,吳棟,
申請(qǐng)(專(zhuān)利權(quán))人:杭州安恒信息技術(shù)股份有限公司,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。