System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據處理領域。更具體地,本專利技術涉及一種數據智能化分析方法及系統。
技術介紹
1、在工業生產過程中,各種傳感器和檢測設備會實時采集大量的數據,這些數據反映了生產過程的各個方面,如溫度、壓力、流量、振動等。正常情況下,這些數據應該在一定的范圍內波動,反映出生產過程的穩定狀態。當生產過程中出現異常時,例如設備故障、工藝參數偏差、原材料質量變化等,這些異常會直接影響到生產數據的變化,通過智能化分析采集到的數據,可以檢測到生產過程中的異常情況。
2、現有技術如公開號為cn117708636a的專利申請文件公開了一種基于大數據的數據分析方法,該數據分析方法包括:通過輸入原始數據,通過時序圖和箱線圖獲得原始數據的分布特征,根據測點數據正常波動范圍,在原始數據的分布特征中剔除超限值,填充原始數據中的數據缺失值,采用dfa進行原始數據的去趨勢處理,以消除數據趨勢項,采用k-means聚類算法對原始數據進行聚類分析,并確定異常判斷閾值,使用異常判斷閾值與數據集密度的比較,判斷數據集密度是否小于異常判斷閾值,若是,則相應的原始數據為異常數據,否則為正常數據。
3、但是上述專利申請文件未考慮到數據變化的特點(如短期波動或周期性變化)以及閾值判斷的滯后性,導致對數據進行異常檢測的準確性下降。
技術實現思路
1、為解決上述對數據進行異常檢測的準確性下降的技術問題,本專利技術在如下的多個方面中提供方案。
2、在第一方面中,一種數據智能化分析方法,包括:
>3、將采集的數據按照時間順序排序,并構建數據隨時間變化的曲線;
4、將所述曲線分解為趨勢項、季節項和殘差項三個分量,并結合趨勢項和季節項的特征將所述曲線劃分為多個劃分數據段,分別計算各劃分數據段對應的趨勢項的異常程度、季節項的異常程度和殘差項的異常程度;
5、計算各劃分數據段的綜合異常程度,并使用殘差項的異常程度進行修正,得到各劃分數據段修正后的綜合異常程度,所述修正后的綜合異常程度滿足關系式為:;式中,為第個劃分數據段修正后的綜合異常程度,為綜合異常程度,為第個劃分數據段對應的季節項的異常程度,為第個劃分數據段對應的趨勢項的異常程度,為第個劃分數據段的殘差項的異常程度,為最大值;
6、當劃分數據段的異常程度大于或等于預設的閾值時,觸發警報機制。
7、本專利技術通過構建曲線直觀地展示出來采集的數據的變化趨勢,進一步將曲線分解為趨勢項、季節項和殘差項,并將曲線劃分為多個劃分數據段,分別計算劃分數據段對應趨勢項的異常程度、季節項的異常程度和殘差項的異常程度;
8、其中,季節項和趨勢項雖然能夠反映數據的長期變化的周期性波動,但是無法完全捕捉數據中的所有異常,殘差項作為數據中的剩余部分,包含了除趨勢和季節因素外的所有信息,進而根據上述修正方式,既考慮了主要異常對綜合異常程度的主導作用,又賦予了殘差項在異常檢測中的重要作用,從而提高了數據評估的準確性和可靠性。
9、優選地,所述分解采用stl分解法。
10、優選地,所述結合趨勢項和季節項的特征將所述曲線劃分為多個數據段包括:
11、分別識別趨勢項和季節項的轉折點,根據趨勢項的轉折點將曲線劃分為多個趨勢段,根據季節項的轉折點將每個趨勢段劃分為多個子段,進而得到多個劃分數據段。
12、不同的數據段可能代表不同的趨勢階段或季節模式。通過劃分數據段,可以更清晰地看到數據在不同階段和模式下的差異,從而進行更有針對性的分析和處理。
13、優選地,使用自相關函數獲取曲線的所有周期及周期長度,對所有周期進行聚類,得到多個周期類別,將類別內元素數量最多的類別的中心點作為參考點,則數據段對應的季節項的每個周期的異常程度為:
14、;式中,為第個類別中第個元素所代表的周期的異常程度,為第個類別中元素的數量,為所有周期的數量,為第個類別中第個元素到參考點的距離,為所有類別中元素到參考點的距離的最大值,為構建的窗口大小,為窗口內第個周期的參數;
15、將周期的異常程度映射到劃分數據段上,進而得到各個劃分數據段對應的季節項的異常程度。
16、在受到噪聲干擾的周期數據中,使用自相關函數能夠顯示出明顯的周期性,通過計算每個周期的異常程度,可以定量評估每個周期與正常周期的偏離程度,異常程度較高的周期可能代表了數據中的異常事件或噪聲干擾。
17、優選地,若窗口內第個周期為正常周期,則取值為1,反之取值為0。
18、通過設置為0或1,我們可以對每個周期進行精細的評估。這種評估方式不僅考慮了周期到參考點的距離,還考慮了周期本身的狀態(正常或異常),使得數據的評估結果更加全面和準確。
19、優選地,將趨勢項分量劃分為多個初始數據段,計算每個初始數據段的平均斜率,對每個初始數據段的平均斜率進行聚類,將類別內包含元素數量最多的類別的類內中心點的值作為數據的參考斜率值,計算初始數據段的異常程度,則初始數據段的異常程度滿足關系式為:
20、;式中,為趨勢項中第個初始數據段的異常程度,為第個初始數據段上第個數據的異常分數,為第個初始數據段上的數據總數,為第個初始數據段上數據的斜率平均值,為斜率參考值,為所有初始數據段中對應的斜率平均值與斜率參考值的差值的最大值;進而將初始數據段的異常程度映射到對應劃分數據段的趨勢項的異常程度。
21、通過劃分初始數據段并計算其平均斜率,可以更細致地捕捉數據的局部特征,而不僅僅是整體趨勢,有助于更準確地識別出數據的上升、下降或平穩趨勢,尤其是在數據存在波動或噪聲時。
22、優選地,劃分數據段對應的殘差項的異常程度滿足關系式為:
23、;式中,為第個劃分數據段的殘差項的異常程度,為第個劃分數據段的殘差項中所有數據的均值,為第個劃分數據段的殘差項中所有數據的均值的中位數,為整個殘差項中數據的最大值,為整個殘差項中數據的最小值,為第個劃分數據段的殘差項中所有數據的方差,為整個殘差項數據的方差。
24、通過計算殘差項的均值、中位數以及方差,并結合整個殘差項的最大值和最小值,可以更準確地識別出與整體趨勢不符的數據段。這種方法有助于減少誤報率,提高異常檢測的準確性。
25、第二方面,一種數據智能化分析系統,包括:處理器和存儲器,所述存儲器存儲有計算機程序指令,當所述計算機程序指令被所述處理器執行時實現上述的數據智能化分析方法。
26、本專利技術的有益效果是:
27、通過將數據曲線分解為趨勢項、季節項和殘差項三個分量,能夠從不同維度全面識別數據中的異常情況。趨勢項關注數據的整體變化趨勢,季節項分析數據的周期性波動,殘差項捕捉數據中的隨機波動,綜合考慮三者,可以更全面地發現數據中的異常。
28、根據趨勢項和季節項的特征靈活劃分數據段,先識別趨勢項的轉折點劃分趨勢段,再根據季節項的轉折點將每個趨勢段細分為子段。這種劃分方式能夠適應不同數據的特點和需本文檔來自技高網...
【技術保護點】
1.一種數據智能化分析方法,其特征在于,包括:
2.根據權利要求1所述的一種數據智能化分析方法,其特征在于,所述分解采用STL分解法。
3.根據權利要求2所述的一種數據智能化分析方法,其特征在于,所述結合趨勢項和季節項的特征將所述曲線劃分為多個數據段包括:
4.根據權利要求3所述的一種數據智能化分析方法,其特征在于,使用自相關函數獲取曲線的所有周期及周期長度,對所有周期進行聚類,得到多個周期類別,將類別內元素數量最多的類別的中心點作為參考點,則數據段對應的季節項的每個周期的異常程度為:
5.根據權利要求4所述的一種數據智能化分析方法,其特征在于,若窗口內第個周期為正常周期,則取值為1,反之取值為0。
6.根據權利要求5所述的一種數據智能化分析方法,其特征在于,將趨勢項分量劃分為多個初始數據段,計算每個初始數據段的平均斜率,對每個初始數據段的平均斜率進行聚類,將類別內包含元素數量最多的類別的類內中心點的值作為數據的參考斜率值,計算初始數據段的異常程度,則初始數據段的異常程度滿足關系式為:
7.根據權利要求6所述
8.一種數據智能化分析系統,其特征在于,包括:處理器和存儲器,所述存儲器存儲有計算機程序指令,當所述計算機程序指令被所述處理器執行時實現根據權利要求1-7任一項所述的數據智能化分析方法。
...【技術特征摘要】
1.一種數據智能化分析方法,其特征在于,包括:
2.根據權利要求1所述的一種數據智能化分析方法,其特征在于,所述分解采用stl分解法。
3.根據權利要求2所述的一種數據智能化分析方法,其特征在于,所述結合趨勢項和季節項的特征將所述曲線劃分為多個數據段包括:
4.根據權利要求3所述的一種數據智能化分析方法,其特征在于,使用自相關函數獲取曲線的所有周期及周期長度,對所有周期進行聚類,得到多個周期類別,將類別內元素數量最多的類別的中心點作為參考點,則數據段對應的季節項的每個周期的異常程度為:
5.根據權利要求4所述的一種數據智能化分析方法,其特征在于,若窗口內第個周期為正常周期,則取值為1,...
【專利技術屬性】
技術研發人員:楊合新,劉喜闊,張釗,李兵,倪思農,
申請(專利權)人:河北沃茵環保科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。