System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據挖掘以及信息處理,尤其涉及一種遺傳算法進行關聯規則挖掘的方法、裝置、設備及介質。
技術介紹
1、現代信息系統產生的日志數據量巨大,數據結構復雜,包含大量的非結構化和半結構化數據,傳統的關聯規則挖掘方法不僅計算量大、時間復雜度高,難以滿足實時性和高效性的要求,而且在處理這些數據時,往往采用貪心策略,容易陷入局部最優解,無法全局搜索最優的規則組合,影響了規則挖掘的效果。
2、同時,由于缺乏對規則的優化,傳統方法生成的關聯規則可能存在冗余、重復或低質量的問題,難以直接應用于實際業務。因此,本申請基于遺傳算法對關聯規則進行挖掘,能夠得到全局最優解。
技術實現思路
1、基于此,本專利技術提供了一種遺傳算法進行關聯規則挖掘的方法、裝置、設備及介質,以解決傳統關聯規則挖掘方法效率低且易陷入局部最優的問題。
2、第一方面,本專利技術實施例提供了一種遺傳算法進行關聯規則挖掘的方法,該方法包括:
3、響應于用戶端發起的關聯規則挖掘的指令,獲取原始日志數據并進行初始化,得到初始化日志數據;
4、對初始化數據按照預定義的關聯策略進行關聯,得到多個關聯規則,按照預先構建的支持度函數以及置信度函數計算每個關聯規則的支持度以及置信度;
5、按照預先設定的編碼規則對每個關聯規則進行編碼,并將所述每個關聯規則下計算所得的支持度與置信度的值作為實數值,與每個編碼后的規則進行組合,得到遺傳算法中的多個初始個體,構成初始種群;
6、
7、將參與最后一輪迭代的全部新個體按照適應度值由高到低的順序進行排序,并根據排序結果將適應度最高的個體所對應的關聯規則進行提取,作為最優關聯規則輸出至用戶端。
8、第二方面,本專利技術實施例提供了一種遺傳算法進行關聯規則挖掘的裝置,該裝置包括:
9、日志初始化模塊,用于響應于用戶端發起的關聯規則挖掘的指令,獲取原始日志數據并進行初始化,得到初始化日志數據;
10、關聯規則計算模塊,用于對初始化數據按照預定義的關聯策略進行關聯,得到多個關聯規則,按照預先構建的支持度函數以及置信度函數計算每個關聯規則的支持度以及置信度;
11、初始種群構建模塊,用于按照預先設定的編碼規則對每個關聯規則進行編碼,并將所述每個關聯規則下計算所得的支持度與置信度的值作為實數值,與每個編碼后的規則進行組合,得到遺傳算法中的多個初始個體,構成初始種群;
12、種群迭代模塊,用于對初始種群按照選擇、交叉以及變異三種方式進行多輪迭代,直至收斂;
13、關聯規則挖掘模塊,用于將參與最后一輪迭代的全部新個體按照適應度值由高到低的順序進行排序,并根據排序結果將適應度最高的個體所對應的關聯規則進行提取,作為最優關聯規則輸出至用戶端。
14、第三方面,本專利技術實施例提供了一種電子設備,所述電子設備包括:
15、至少一個處理器;以及
16、與所述至少一個處理器通信連接的存儲器;其中,
17、所述存儲器存儲有可被所述至少一個處理器執行的計算機程序,所述計算機程序被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本專利技術任一實施例所述的一種遺傳算法進行關聯規則挖掘的方法。
18、第四方面,還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機指令,所述計算機指令用于使處理器執行時實現本專利技術任一實施例所述的一種遺傳算法進行關聯規則挖掘的方法。
19、本專利技術實施例的技術方案,利用了遺傳算法可全局搜索的特性來對日志關聯規則進行最優化挖掘,首先通過將支持度和置信度進行實數編碼后存儲至個體的基因序列中,通過迭代和評估實現了參數的自動優化,避免了手動設定閾值的繁瑣過程,不僅提高了規則挖掘效率,也增強了挖掘結果的準確性。其次,在遺傳算法中的選擇、交叉以及變異操作增加了規則的多樣性,有助于算法在更廣泛的解空間中搜索最優解,提高了全局搜索能力。
20、應當理解,本部分所描述的內容并非旨在標識本專利技術的實施例的關鍵或重要特征,也不用于限制本專利技術的范圍。本專利技術的其它特征將通過以下的說明書而變得容易理解。
本文檔來自技高網...【技術保護點】
1.一種遺傳算法進行關聯規則挖掘的方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,對初始化數據按照預定義的關聯策略進行關聯,得到多個關聯規則,包括:
3.根據權利要求2所述的方法,其特征在于,根據與各前后項屬性名關系對中的前項屬性名和后項屬性名分別對應的屬性值集合,組合得到多個關聯規則,包括:
4.根據權利要求2或3所述的方法,其特征在于,按照預先構建的支持度函數以及置信度函數計算每個關聯規則的支持度以及置信度,包括:
5.根據權利要求2的方法,其特征在于,在各初始化日志數據中分別讀取屬性信息對之后,還包括:
6.根據權利要求5所述的方法,其特征在于,根據構建的屬性值集合以及預先設定的編碼規則對每個關聯規則進行編碼,包括:
7.根據權利要求1所述的方法,其特征在于,對初始種群按照選擇、交叉以及變異三種方式進行多輪迭代,直至收斂,包括:
8.一種遺傳算法進行關聯規則挖掘的裝置,其特征在于,包括:
9.一種電子設備,其特征在于,所述電子設備包括:
10.一種
...【技術特征摘要】
1.一種遺傳算法進行關聯規則挖掘的方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,對初始化數據按照預定義的關聯策略進行關聯,得到多個關聯規則,包括:
3.根據權利要求2所述的方法,其特征在于,根據與各前后項屬性名關系對中的前項屬性名和后項屬性名分別對應的屬性值集合,組合得到多個關聯規則,包括:
4.根據權利要求2或3所述的方法,其特征在于,按照預先構建的支持度函數以及置信度函數計算每個關聯規則的支持度以及置信度,包括:
5.根據權利要求2的方法,其特征在于,在各初始化日志數據中分別讀取屬性信息對之后,還包括:<...
【專利技術屬性】
技術研發人員:尚丹寧,
申請(專利權)人:北京優特捷信息技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。