System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請屬于代碼分析,尤其涉及基于深度學(xué)習(xí)的函數(shù)入口特征識別方法、裝置及設(shè)備。
技術(shù)介紹
1、函數(shù)入口特征識別是一項(xiàng)在程序分析、逆向工程和漏洞檢測等領(lǐng)域中非常重要的任務(wù)。識別函數(shù)入口有助于理解代碼結(jié)構(gòu)、優(yōu)化編譯器或調(diào)試程序。函數(shù)入口特征的識別過程是通過分析代碼的結(jié)構(gòu)和行為,識別代碼中的函數(shù)入口點(diǎn)。函數(shù)入口特征識別方法包括靜態(tài)分析工具、動態(tài)分析工具等。
2、現(xiàn)有技術(shù)中,函數(shù)入口特征識別方法需要手工特征提取,預(yù)定義的特征和規(guī)則無法涵蓋所有函數(shù)入口的情況,對代碼混淆、變種和新型模式的適應(yīng)性差。對于包含復(fù)雜控制流和跳轉(zhuǎn)的代碼,現(xiàn)有的函數(shù)入口特征識別方法難以準(zhǔn)確識別函數(shù)入口。現(xiàn)有的函數(shù)入口特征識別方法對不同參數(shù)傳遞方式和寄存器使用模式的適應(yīng)性不足。
3、綜上所述,傳統(tǒng)的函數(shù)入口特征識別方法存在泛化能力弱和識別準(zhǔn)確率不高的問題。
技術(shù)實(shí)現(xiàn)思路
1、本申請實(shí)施例提供了一種基于深度學(xué)習(xí)的函數(shù)入口特征識別方法、裝置及設(shè)備,可以解決相關(guān)技術(shù)中,函數(shù)入口特征識別方法存在泛化能力弱和識別準(zhǔn)確率不高的問題。
2、第一方面,本申請實(shí)施例提供了一種基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,包括:
3、獲取測試集數(shù)據(jù);其中,所述測試集數(shù)據(jù)包括不同編程語言的代碼和不同風(fēng)格的代碼;
4、利用識別模型識別所述測試集數(shù)據(jù)的函數(shù)入口,得到識別結(jié)果;其中,所述識別模型是深度學(xué)習(xí)transformer模型,所述識別模型用于識別函數(shù)入口,所述識別結(jié)果包括所述測試集數(shù)據(jù)的函數(shù)入口
5、根據(jù)所述識別結(jié)果,確定所述測試集數(shù)據(jù)的函數(shù)入口代碼。
6、本申請實(shí)施例中上述的技術(shù)方案,至少具有如下技術(shù)效果:
7、本申請?zhí)峁┑幕谏疃葘W(xué)習(xí)的函數(shù)入口特征識別方法,先通過獲取測試集數(shù)據(jù),測試集數(shù)據(jù)可以是不同編程語言的代碼和不同風(fēng)格的代碼,再利用識別模型(深度學(xué)習(xí)transformer模型)識別測試集數(shù)據(jù)的函數(shù)入口,得到識別結(jié)果,利于得知測試集數(shù)據(jù)的函數(shù)入口特征向量,最后根據(jù)識別結(jié)果,確定測試集數(shù)據(jù)的函數(shù)入口代碼。通過實(shí)驗(yàn)對比傳統(tǒng)函數(shù)入口特征識別模型和基于深度學(xué)習(xí)的函數(shù)入口特征識別模型的準(zhǔn)確率和召回率,驗(yàn)證了該方法能夠顯著提高函數(shù)入口特征識別方法的準(zhǔn)確率和召回率。該方法能夠?qū)崿F(xiàn)函數(shù)入口特征識別的自動化,通過訓(xùn)練好的模型,可以在大規(guī)模代碼庫中自動識別函數(shù)入口,減少了人工標(biāo)注和檢查的工作量,提高了效率。該方法能夠識別不同編程語言和不同風(fēng)格的代碼中的函數(shù)入口,具有較強(qiáng)的泛化能力。
8、第二方面,本申請實(shí)施例提供了一種基于深度學(xué)習(xí)的函數(shù)入口特征識別裝置,包括:
9、獲取單元,用于獲取測試集數(shù)據(jù);其中,所述測試集數(shù)據(jù)包括不同編程語言的代碼和不同風(fēng)格的代碼;
10、識別單元,用于利用識別模型識別所述測試集數(shù)據(jù)的函數(shù)入口,得到識別結(jié)果;其中,所述識別模型是深度學(xué)習(xí)transformer模型,所述識別模型用于識別函數(shù)入口,所述識別結(jié)果包括所述測試集數(shù)據(jù)的函數(shù)入口特征向量;
11、函數(shù)入口代碼得到單元,用于根據(jù)所述識別結(jié)果,確定所述測試集數(shù)據(jù)的函數(shù)入口代碼。
12、第三方面,本申請實(shí)施例提供了一種基于深度學(xué)習(xí)的函數(shù)入口特征識別設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一方面中的任一實(shí)施例所述的方法。
13、可以理解的是,上述第二方面至第三方面的有益效果可以參見上述第一方面中的相關(guān)描述,在此不再贅述。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,包括:
2.如權(quán)利要求1所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述方法還包括:
3.如權(quán)利要求2所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述對所述樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,得到樣本特征向量,包括:
4.如權(quán)利要求3所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述基于所述樣本特征向量,得到所述識別模型,包括:
5.如權(quán)利要求4所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述基于所述輸入數(shù)據(jù),對所述初始識別模型進(jìn)行模型訓(xùn)練操作,得到所述識別模型,包括:
6.如權(quán)利要求5所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述利用所述識別模型識別所述測試集數(shù)據(jù)的函數(shù)入口,得到識別結(jié)果,包括:
7.如權(quán)利要求6所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述根據(jù)所述識別結(jié)果,確定所述測試集數(shù)據(jù)的函數(shù)入口代碼,包括:
8.如權(quán)利要求6所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述根
9.一種基于深度學(xué)習(xí)的函數(shù)入口特征識別裝置,其特征在于,包括:
10.一種基于深度學(xué)習(xí)的函數(shù)入口特征識別設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至8任一項(xiàng)所述的方法。
...【技術(shù)特征摘要】
1.一種基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,包括:
2.如權(quán)利要求1所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述方法還包括:
3.如權(quán)利要求2所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述對所述樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,得到樣本特征向量,包括:
4.如權(quán)利要求3所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述基于所述樣本特征向量,得到所述識別模型,包括:
5.如權(quán)利要求4所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方法,其特征在于,所述基于所述輸入數(shù)據(jù),對所述初始識別模型進(jìn)行模型訓(xùn)練操作,得到所述識別模型,包括:
6.如權(quán)利要求5所述的基于深度學(xué)習(xí)的函數(shù)入口特征識別方...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:杜磊,王仕衛(wèi),宋艷飛,徐九八,游明卓,
申請(專利權(quán))人:江西智慧云測安全檢測中心股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。