System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)屬于軟件缺陷預(yù)測領(lǐng)域,涉及一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法。
技術(shù)介紹
1、隨著軟件項目的復(fù)雜性和規(guī)模的不斷增加,軟件缺陷預(yù)測成為保證軟件質(zhì)量的關(guān)鍵技術(shù)之一。傳統(tǒng)的軟件缺陷預(yù)測方法依賴于統(tǒng)計分析、機器學習等技術(shù),其中優(yōu)化算法常用于特征選擇和模型優(yōu)化。
2、然而,現(xiàn)有的優(yōu)化算法如遺傳算法、粒子群優(yōu)化算法、白鯨優(yōu)化算法在處理高維度數(shù)據(jù)時,存在易陷入局部最優(yōu)、收斂速度慢以及全局搜索能力不足的問題,同時在使用這些算法進行特征選擇時易出現(xiàn)選取的特征有冗余、無關(guān)特征的問題,這直接影響了軟件缺陷預(yù)測的精度和效率。
技術(shù)實現(xiàn)思路
1、為了解決軟件源代碼缺陷預(yù)測過程中特征選擇時易出現(xiàn)選取的特征有冗余、無關(guān)特征的問題,本專利技術(shù)采用的技術(shù)方案是:一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,包括以下步驟:
2、獲取待預(yù)測軟件源代碼所在的文件夾的單個文件的傳統(tǒng)特征,構(gòu)成數(shù)據(jù)集;
3、對待預(yù)測軟件的數(shù)據(jù)集進行預(yù)處理;
4、對預(yù)處理后預(yù)測軟件的數(shù)據(jù)集按照比例劃分為測試集和訓(xùn)練集;
5、基于訓(xùn)練集數(shù)據(jù),采用改進的白鯨優(yōu)化算法進行訓(xùn)練,篩選出待預(yù)測軟件源代碼文件對應(yīng)的傳統(tǒng)特征;
6、采用篩選出的傳統(tǒng)特征,基于測試集數(shù)據(jù),實現(xiàn)對待軟件源代碼的缺陷數(shù)量進行預(yù)測。
7、進一步地:所述對待預(yù)測軟件的數(shù)據(jù)集進行預(yù)處理的過程包括:
8、使用min-max對數(shù)據(jù)集的數(shù)據(jù)進行歸一化處理,具體處理為:
9、使用smote對數(shù)據(jù)集進行平衡化處理,具體處理為:從數(shù)據(jù)集中識別出屬于少數(shù)類的樣本,對于每個少數(shù)類樣本,計算少數(shù)類樣本與同一類中其他樣本之間的距離,合成樣本生成:對于每個少數(shù)類樣本及其k個最近鄰,在這些樣本之間生成新的合成樣本,重復(fù)上述過程,直到達到所需的類別平衡水平。
10、進一步地:所述基于訓(xùn)練集數(shù)據(jù),采用改進的白鯨優(yōu)化算法進行訓(xùn)練,篩選出待預(yù)測軟件源代碼文件對應(yīng)的特征的過程包括:
11、初始化階段:引入了cubic混沌映射,以生成分布更均勻的初始種群,計算每只白鯨的適應(yīng)度值,并對種群的位置信息進行更新;
12、計算計算概率的函數(shù)wf和平衡因子bf;
13、將平衡因子bf與平衡因子閾值進行比較,當平衡因子bf>平衡因子閾值時,進入探索階段,以改進三角游走方法在搜索空間內(nèi)移動,得到白鯨游走后的位置;
14、當平衡因子bf≤平衡因子閾值時,進入開發(fā)階段,采用levy飛行機制函數(shù)的數(shù)學模型生成具有重尾分布的隨機步長,根據(jù)當前選取的最優(yōu)特征的位置來調(diào)整自己的方向和位置;
15、將平衡因子bf<概率的函數(shù)wf時,進入鯨落階段,更新步長因子c2,計算步長尺寸xstep,選擇掉落概率模擬微小變化,確保種群數(shù)量不變,計算概率p和服從指數(shù)分布的概率值ps,通過柯西變異與反向?qū)W習結(jié)合的策略更新白鯨位置,即當p<ps時使用柯西變異策略,反之使用反向?qū)W習策略,動態(tài)地隨機更新目標位置,得到更新后的鯨落階段的數(shù)學模型;
16、針對當前鯨落個體,利用麻雀警戒機制幫助其他個體避免陷入相同的局部最優(yōu)或進一步優(yōu)化自己的解,麻雀警戒機制即對當前位置,引入?yún)?shù)β和r,其中β是控制搜索范圍的比例因子,r是隨機向量作用是讓被警告?zhèn)€體按照與鯨落個體不一樣的方向進行隨機搜索;
17、判斷是否達到迭代次數(shù),若到達,則結(jié)束循環(huán),否則返回重新計算概率的函數(shù)wf和平衡因子bf。
18、進一步地:cubic混沌映射公式表示為:
19、
20、其中:xn表示第n個種群的位置,ρ表示混度因子,當x0=0.3,ρ=2.595時,cubic映射具有較好的混沌遍歷性。
21、進一步地:所述以三角游走方法在搜索空間內(nèi)移動,得到白鯨游走后的位置的過程如下:
22、首先基于白鯨和同類之間的距離dis,表示為:
23、
24、其中為第t代的目標解,為第i條白鯨在第t代的位置。
25、獲得白鯨游走的步長范圍range,表示為:
26、range=α·dis1?????????????????????????(7)
27、其中:α為服從正態(tài)分布的隨機數(shù);
28、定義白鯨移動的方向β,表示為:
29、β=2πα?????????????????????????(8)
30、其中:α為服從正態(tài)分布的隨機數(shù),
31、求得游走位置和同類的最終距離dist,表示為:
32、dist=dis2+range2-2·dis·range·cos(β)????????????(9)
33、更新白鯨游走后的位置,表示為。
34、
35、進一步地:levy飛行機制函數(shù)的數(shù)學模型為lf:
36、
37、其中,u和v是服從正態(tài)分布的隨機數(shù),β默認為1.5,參數(shù)σ的數(shù)學模型為:
38、
39、進一步地:所述鯨落階段的數(shù)學模型為:
40、
41、其中:ω是調(diào)節(jié)因子,當ω為0.05是函數(shù)的優(yōu)化結(jié)果最優(yōu);是第t代目標解的反向解;是第t+1代目標解;ub和lb是上下界;r是服從(0,1)標準均勻分布的隨機數(shù);cauchy(0,1)為標準柯西分布函數(shù);b3是偽信息交流系數(shù),表達式為:
42、
43、其中:α為隨機初始值,β為衰減率,t為當前迭代次數(shù),tmax為最大迭代次數(shù)。
44、一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇裝置,包括
45、獲取模塊:用于獲取待預(yù)測軟件源代碼所在的文件夾的單個文件的傳統(tǒng)特征,構(gòu)成數(shù)據(jù)集;
46、預(yù)處理模塊:用于對待預(yù)測軟件的數(shù)據(jù)集進行預(yù)處理;
47、劃分模塊:用于對預(yù)處理后預(yù)測軟件的數(shù)據(jù)集按照比例劃分為測試集和訓(xùn)練集;
48、訓(xùn)練階段:用于基于訓(xùn)練集數(shù)據(jù),采用改進的白鯨優(yōu)化算法進行訓(xùn)練,篩選出待預(yù)測軟件源代碼文件對應(yīng)的傳統(tǒng)特征;
49、預(yù)測階段:使用篩選出的傳統(tǒng)特征,基于測試集數(shù)據(jù),實現(xiàn)對待軟件源代碼的缺陷數(shù)量進行預(yù)測。
50、一種計算機設(shè)備,包括:處理器和存儲器,所述存儲器存儲程序模塊,其特征在于,所述程序模塊在所述處理器運行,實現(xiàn)如一項所述的方法。
51、本專利技術(shù)提供的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,具有以下優(yōu)點:
52、本專利技術(shù)提出的算法的探索階段通過模擬白鯨的游泳行為,增強了算法的全局搜索能力,有助于在特征選擇中發(fā)現(xiàn)更廣泛的特征組合;本專利技術(shù)提出的算法的開發(fā)階段通過模擬白鯨的捕食行為,提高了算法的局部搜索精度,本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:所述對待預(yù)測軟件的數(shù)據(jù)集進行預(yù)處理的過程包括:
3.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:所述基于訓(xùn)練集數(shù)據(jù),采用改進的白鯨優(yōu)化算法進行訓(xùn)練,篩選出待預(yù)測軟件源代碼文件對應(yīng)的特征的過程包括:
4.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:
5.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:所述以三角游走方法在搜索空間內(nèi)移動,得到白鯨游走后的位置的過程如下:
6.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:Levy飛行機制函數(shù)的數(shù)學模型為LF:
7.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:所述鯨落階段的數(shù)學模型為:
8.一種
9.一種計算機設(shè)備,包括:處理器和存儲器,所述存儲器存儲程序模塊,其特征在于,所述程序模塊在所述處理器運行,實現(xiàn)如權(quán)利要求1-7任一項所述的方法。
...【技術(shù)特征摘要】
1.一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:所述對待預(yù)測軟件的數(shù)據(jù)集進行預(yù)處理的過程包括:
3.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:所述基于訓(xùn)練集數(shù)據(jù),采用改進的白鯨優(yōu)化算法進行訓(xùn)練,篩選出待預(yù)測軟件源代碼文件對應(yīng)的特征的過程包括:
4.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺陷預(yù)測特征選擇方法,其特征在于:
5.根據(jù)權(quán)利要求1所述的一種基于改進白鯨優(yōu)化算法的軟件缺...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王巖,何靜杰,邱少明,呂亞娜,
申請(專利權(quán))人:大連大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。