System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于電力通信領域,涉及電力通信網絡日志異常信息檢測,具體涉及一種基于增量學習的電力通信網絡日志異常信息檢測方法。
技術介紹
1、隨著面向“源網荷儲”的新型電力系統的建設,電網的規模和復雜性持續擴大,作為電力系統安全穩定運行三大支柱之一的電力通信網也呈現出爆炸性增長的趨勢。在這一背景下,高效的電力通信網風險分析手段已成為保障網絡穩定運行的核心問題。電力通信網的風險分析與網絡運行日志密切相關,日志數據具有普及性、精確性和連續性的優點,易于獲取且持續不斷生成的同時準確描述電力通信網的信息,但是如何從海量的運行、檢修、缺陷及資源等日志中準確提取和分析異常信息,挖掘其中不是顯而易見的潛在模式和信息,成為了風險分析的關鍵所在。
2、傳統的日志異常檢測方法基于機器學習和深度學習算法。傳統的機器學習算法通常在明確提供的特征上執行,liang等人設計了五組特征描述時間窗口中事件的數量及分布等情況,然后使用多種分類器進行異常檢測。實驗結果證明定制的最近鄰分類器(knn)表現遠遠優于支持向量機(svm)。liu等人提出logcluster對日志序列進行聚類,并計算聚類形心作為代表性序列,以幫助開發人員快速識別潛在問題。深度學習方法可以自動學習數據的特征表示,無需手動設計特征工程,yang等人根據聚類結果對未標記數據進行概率估計,發揮監督方法的優越性。為了減少長依賴問題損害異常檢測的有效性,使用基于注意力的門控循環單元(gru)進行異常檢測。wang等人提出的oc4seq是一種用于檢測離散事件序列中異常的多尺度單類遞歸神經網絡,設
3、然而,在處理電力通信網中數量龐大、類型多樣且隨時間動態演變的日志數據時,這些方法所面臨的核心挑戰在于災難性遺忘問題。具體而言,傳統模型難以有效適應日志數據的這種高度動態性和實時性特征。隨著新數據的持續生成,模型在逐步學習新任務的過程中,對于先前已學習任務的表現會急劇下滑,從而導致模型整體性能的顯著下降。此外,受限于有限的運行內存以及任務類別間可能存在的復雜交織與重疊,如何高效利用并深入分析電力通信網的日志數據,構成了另一項重大挑戰。
技術實現思路
1、專利技術目的:為了克服現有技術中存在的不足,提供一種基于增量學習的電力通信網絡日志異常信息檢測方法,通過持續學習新數據來優化模型,提高了電力通信網的的日志數據利用率和異常檢測的實時性。
2、技術方案:為實現上述目的,本專利技術提供一種基于增量學習的電力通信網絡日志異常信息檢測方法,包括如下步驟:
3、s1:對原始數據進行預處理;
4、s2:對預處理后的數據進行特征提取;
5、s3:將提取的特征數據輸入到構建好的增量學習模型中,進行模型更新;
6、s4:利用更新好的增量學習模型輸出電力通信網絡日志異常信息檢測結果。
7、進一步地,所述步驟s1中預處理的方法包括:
8、電網日志數據常常包含噪聲、重復或缺失值,且因為開發者可以在源代碼中編寫自由文本的日志消息,所以原始日志消息通常是非結構化的。而后續的深度學習模型進行特征提取時需要數據結構化輸入(如事件列表或矩陣)。因此,日志分析的第一步是日志解析,將非結構化日志消息轉換為結構化事件。一個非結構化日志消息通常包含各種形式的系統運行時信息:時間戳(記錄事件發生的時間)、詳細級別(指示事件的嚴重性級別,如info)和原始消息內容(服務操作的自由文本描述)。
9、因此,本專利技術采用一種基于固定深度樹的在線日志解析方法drain實現日志解析,當新的原始日志消息到達時,drain會根據領域知識通過簡單的正則表達式對其進行預處理,然后根據編碼,在樹的內部節點中的特定規則搜索日志組,即樹的葉節點,如果找到合適的日志組,則將日志消息與該日志組中存儲的日志事件進行匹配,否則,將根據日志消息創建一個新的日志組。
10、進一步地,所述步驟s2中特征提取的方式為:
11、為了符合模型的結構化輸入,并且提高模型效率和準確性,因此需要提取關鍵特征。電網日志中的特征可能包括時間戳、設備類型、操作類型、設備狀態碼等;
12、本專利技術使用預訓練的語言模型bert學習初始日志序列語義向量,bert模型具有多個transformer編碼器,每個編碼器都有應用了自注意力機制的多頭注意力層和前饋網絡層(ffn),并采用了殘差網絡和歸一化操作,最后通過計算idf權重,將每個日志序列的發生頻率與其初始日志序列語義向量集成形成最后的日志序列語義表達。
13、進一步地,所述步驟s3中增量學習模型的構建方法為:
14、采用暗經驗回放der參與到增量學習模型的構建,der針對新任務樣本使用交叉熵損失監督訓練,針對范例樣本使用蒸餾損失回放。由于der具有簡單高效、不需要任務邊界和不依賴數據任務標識等優點,使其能夠適應很多嚴格的增量學習設置,如任務增量學習、類增量學習、域增量學習、在線增量學習等。
15、進一步地,所述步驟s3中暗經驗回放的增量更新任務被看作t個有序的分類任務,輸入樣本x和其真實標簽y從每個任務t∈{1,…,t}中的分布dt中抽取,分類器f按照時間順序以θ為參數依次在每個任務上進行更新;目標是正確分類在給定任務tc時對t∈{1,…,tc}的序列樣本數據:
16、
17、hθ(x)表示模型輸出的類別原始分數,表示類別的概率分布;由于該任務具有時間和空間復雜度的挑戰性,所以先前任務的數據被假設為不可用;因此需要尋找適合當前任務的參數,同時在舊任務中訓練的參數也要有效保留,所以需要網絡模仿其對過去樣本的原始響應;為了保留關于先前任務的知識,尋求最小化以下目標:
18、
19、其中,α是損失之間權衡的超參數,是任務t結束時的最優參數集;通過使用kmeans聚類方法來提取樣本作為經驗,使其可以為后續任務的學習提供支持;在范例樣本的訓練集中,保留了樣本對應的類別原始分數這些分數提供了關于數據點的信息描述;
20、
21、在溫和的假設下,等式(3)中kl散度的優化等價于最小化相應的類型原始分數和預測類別分數之間的歐幾里德距離;模型更新時的優化目標最終轉化為:
22、
23、進一步地,所述步驟s3中需要注意的是,在輸入流中可能會發生突然的分布變化,這會導致范例樣本進行重播時受到到在之前任務中存在高度偏差的樣本的影響。der++通過在目標函數中增加一個額外的項,提升緩沖區數據點相對于其真實標簽的條件似然性,從而更好地應對分布變化;
24、
25、der++引入了一個額外的系數β,用于平衡目標函數中的最后一項;der++通過優化目標函數,促進模型達到更平坦的最小值。這種平坦的最小值有助于模型在參數空間中探索鄰近區域,提高了模型對局部擾動的容忍度,減少了對知識的遺忘。
26、進一步地,所述步驟s3中模型更新的方式為:<本文檔來自技高網...
【技術保護點】
1.一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S1中預處理的方法包括:
3.根據權利要求1所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S2中特征提取的方式為:
4.根據權利要求1所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S3中增量學習模型的構建方法為:
5.根據權利要求4所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S3中暗經驗回放的增量更新任務被看作T個有序的分類任務,輸入樣本x和其真實標簽y從每個任務t∈{1,…,T}中的分布Dt中抽取,分類器f按照時間順序以θ為參數依次在每個任務上進行更新;目標是正確分類在給定任務tc時對t∈{1,…,tc}的序列樣本數據:
6.根據權利要求5所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S3中DER++通過在目標函數
7.根據權利要求5所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S3中模型更新的方式為:
8.根據權利要求7所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S3中在模型更新中引入知識保留與遺忘機制,具體為:
9.根據權利要求1所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S4的增量學習模型中通過基于Mogrifier?LSTM的模型建模日志序列,然后輸入到基于CNN的特征融合層,最后使用softmax函數輸出預測標簽;
10.根據權利要求1所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟S4的增量學習模型中引入反饋機制,通過設計自動反饋回路將檢測到的異常事件發送給人工審核,并根據審核結果調整模型。
...【技術特征摘要】
1.一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟s1中預處理的方法包括:
3.根據權利要求1所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟s2中特征提取的方式為:
4.根據權利要求1所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟s3中增量學習模型的構建方法為:
5.根據權利要求4所述的一種基于增量學習的電力通信網絡日志異常信息檢測方法,其特征在于,所述步驟s3中暗經驗回放的增量更新任務被看作t個有序的分類任務,輸入樣本x和其真實標簽y從每個任務t∈{1,…,t}中的分布dt中抽取,分類器f按照時間順序以θ為參數依次在每個任務上進行更新;目標是正確分類在給定任務tc時對t∈{1,…,tc}的序列樣本數據:
6.根據權利要求5所述的一種基于增量學習的電力通信網絡日志異常信...
【專利技術屬性】
技術研發人員:尉蕊昕,楊有霞,黃生玲,祁生斌,李永鑫,唐玉萍,馬德俊,鄭積元,
申請(專利權)人:國網青海省電力公司信息通信公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。