System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及工業模型推薦,尤其涉及一種工業過程監測模型智能推薦方法與系統。
技術介紹
1、隨著智能制造、自動化等技術的進步,現代工業過程正朝著大規模和智能化的方向發展。然而,日益復雜的工業過程給設備的運行和維護帶來了巨大挑戰。因此,深入研究工業監測應用(例如故障檢測、故障診斷、軟測量等)具有重要意義,有助于避免事故的發生并提高生產質量。近年來,隨著工業傳感器和機器學習算法的發展,基于數據的過程監測算法在工業領域引起了廣泛關注。以故障檢測為例,最流行的多變量統計過程監測方法之一是主成分分析方法,它通過將觀察數據投影到潛在空間來探索變量的自相關性。為處理工業數據的非平穩特性,研究者提出了平穩子空間分析等方法。考慮到工業過程表現出時間相關性,提出了包括慢特征分析在內的動態潛變量算法。同時,基于深度學習的監測方法因其在非線性信息處理中的有效性而受到歡迎,包括自編碼器、卷積神經網絡、循環神經網絡、transformer等。總之,研究者受工業過程特征的啟發,提出并不斷發展了一系列方法。
2、盡管這些算法在特定工業應用中取得了良好效果,但目前沒有單一算法能夠處理所有場景。例如,主成分分析法可能無法處理非高斯或多模態過程數據,慢特征分析方法可能在多階時間相關數據上表現不佳,而神經網絡方法在訓練數據有限時可能會記憶訓練數據中的模式,但無法對未見樣本進行泛化。實際上,有研究提出了無免費午餐定理,證明了如果學習算法a在某些問題上優于學習算法b,那么在其他問題上b必然優于a。該定理表明,沒有算法可以在所有場景中都表現良好。因此,面對多樣化
3、為了解決這個問題,一個直觀的解決方案是逐個訓練和評估所有可用模型,并選擇性能最佳的模型。然而,逐個訓練和評估所有候選模型是耗時的,尤其是對于具有大量超參數的深度學習模型。當需要監測的設備數量較大時,所花費的時間是不可接受的。更重要的是,如果僅有正常或未標記的數據,評估過程可能難以進行。然而,為給定案例選擇合適的模型類似于向可能感興趣的用戶推薦產品,具體可以通過推薦系統實現。在過去的幾十年中,推薦系統取得了巨大成功,可以為特定用戶提供最相關的推薦建議。一般來說,現有的推薦系統主要集中在商業領域,可以分為基于內容的過濾、協同過濾和混合過濾,均依賴于直觀的用戶畫像信息,如性別、年齡、購買記錄、商品評價等。然而,在為工業監測設計模型推薦方法時,時間序列過程數據(類似于用戶)通常由高維傳感器信號組成,這些信號缺乏與商業場景中相關購買行為相聯系的直觀特征。此外,工業監測場景是動態變化的,包括隨著技術進步而出現的新候選算法和隨著新設備的部署而出現的新監測案例,工業模型推薦方法需要具備增量的能力。因此,受到推薦系統的理念啟發,本專利技術擬構建一種工業模型推薦方法,克服了工業信號缺乏直觀特征和監測場景動態變化的挑戰,該方法可以將被監測的對象視為用戶,為其自動推薦適當的監測模型作為產品。
技術實現思路
1、本專利技術的目的在于針對現有技術中工業模型推薦研究領域的空白,提供一種工業過程監測模型智能推薦方法與系統。本專利技術首次提出了工業模型推薦新的任務范式,并構建了基于寬度學習網絡的推薦方法,可將經過數據集特征工程得到的數據集特征映射到數據集在各模型上的得分情況,從而能為模型推薦提供初步推薦結果,極大程度上避免了逐一試驗與評估的高昂成本;本專利技術可應用于包括但不限于能源、化工、注塑等各類工業領域。
2、本專利技術的目的是通過以下技術方案來實現的:本專利技術實施例第一方面提供了一種工業過程監測模型智能推薦方法,包括以下步驟:
3、(1)獲取n個工業對象的時間序列數據集,采用數據集特征工程方法對所有的時間序列數據集進行處理,以獲取每個時間序列數據集對應的數據集特征向量,并將所有的數據集特征向量拼接在一起,得到數據集特征矩陣;
4、(2)對于每個時間序列數據集,利用該時間序列數據集中的訓練集數據訓練預設的m個不同的模型,并在測試集數據上進行測試,得到該時間序列數據集對應的所有模型的測試結果組成的數據集得分向量,并將所有的數據集得分向量進行拼接,得到數據集得分矩陣;
5、(3)利用數據集特征矩陣和數據集得分矩陣,訓練用于建立特征矩陣與得分矩陣的映射關系的寬度學習網絡,以獲取訓練好的寬度學習網絡;并采用三重增量策略對訓練好的寬度學習網絡進行增量更新與優化,以獲取更新后的寬度學習網絡;
6、(4)在線應用時,采用數據集特征工程方法對目標數據集進行處理,得到目標數據集對應的數據集特征向量,并將其輸入至訓練好的或更新后的寬度學習網絡中,得到所有模型對應的數據集得分向量,選取得分最高的模型作為推薦模型。
7、進一步地,所述步驟(1)具體包括:
8、獲取n個工業對象的時間序列數據集,將每個時間序列數據集記為,其中m表示該時間序列數據集中的變量總數,表示該時間序列數據集中的樣本總數;采用數據集特征工程方法對所有的時間序列數據集進行處理,以將每個時間序列數據集轉換成一維特征向量,具體為提取每個時間序列數據集的通用統計特征、分布形狀特征、任務相關特征以及外源知識嵌入特征,并將該一維特征向量作為該時間序列數據集對應的數據集特征向量,其中表示第i個數據集特征向量,k表示數據集特征的個數;將n個時間序列數據集的數據集特征向量拼接在一起,得到數據集特征矩陣。
9、進一步地,所述通用統計特征包括數據集樣本總數量、數據集變量總數m、數據集均值、中位數、標準差、最大值、最小值、四個樣本分位數、四分位距、歸一化均值、歸一化中位數、樣本范圍、樣本基尼系數、絕對中位數偏差、絕對均值偏差、分位數系數離散度、方差系數、處在和之外的異常點數量、處在和之外的異常點數量占比、處在和之外的異常點數量、處在和之外的異常點數量占比、處在1%~99%范圍外的異常點數量、處在1%~99%范圍外的異常點數量占比、處在以外的異常點數量、處在以外的異常點數量占比、各變量稀疏度的均值、各變量稀疏度的最大值、各變量稀疏度的最小值、各變量稀疏度的標準差、各變量稀疏度的偏度、各變量稀疏度的峰度、各變量熵的均值、各變量熵的最大值、各變量熵的最小值、各變量熵的標準差、各變量熵的偏度、各變量熵的峰度、變量間協方差的均值、變量間協方差的最大值、變量間協方差的最小值、變量間協方差的標準差、變量間協方差的偏度、變量間協方差的峰度、變量間相關性的均值、變量間相關性的最大值、變量間相關性的最小值、變量間相關性的標準差、變量間相關性的偏度、變量間相關性的峰度、各變量方差分析p值的均值、各變量方差分析p值的最大值、各變量方差分析p值的最小值、各變量方差分析p值的標準差、各變量方差分析p值的偏度、各變量方差分析p值的峰度;其中iqr表示四分位距;
10、所述分布形狀特征包括正態檢驗、各變量偏度的均值、各變量偏度的最大值、各變量偏度的本文檔來自技高網...
【技術保護點】
1.一種工業過程監測模型智能推薦方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的工業過程監測模型智能推薦方法,其特征在于,所述步驟(1)具體包括:
3.根據權利要求2所述的工業過程監測模型智能推薦方法,其特征在于,所述通用統計特征包括數據集樣本總數量、數據集變量總數m、數據集均值、中位數、標準差、最大值、最小值、四個樣本分位數、四分位距、歸一化均值、歸一化中位數、樣本范圍、樣本基尼系數、絕對中位數偏差、絕對均值偏差、分位數系數離散度、方差系數、處在和之外的異常點數量、處在和之外的異常點數量占比、處在和之外的異常點數量、處在和之外的異常點數量占比、處在1%~99%范圍外的異常點數量、處在1%~99%范圍外的異常點數量占比、處在以外的異常點數量、處在以外的異常點數量占比、各變量稀疏度的均值、各變量稀疏度的最大值、各變量稀疏度的最小值、各變量稀疏度的標準差、各變量稀疏度的偏度、各變量稀疏度的峰度、各變量熵的均值、各變量熵的最大值、各變量熵的最小值、各變量熵的標準差、各變量熵的偏度、各變量熵的峰度、變量間協方差的均值、變量間協方差的最大值、變量間協方差的
4.根據權利要求1所述的工業過程監測模型智能推薦方法,其特征在于,所述利用數據集特征矩陣和數據集得分矩陣,訓練用于建立特征矩陣與得分矩陣的映射關系的寬度學習網絡,以獲取訓練好的寬度學習網絡,具體包括:
5.根據權利要求1所述的工業過程監測模型智能推薦方法,其特征在于,所述三重增量策略包括監測案例增量、候選模型增量以及推薦節點增量的更新策略。
6.根據權利要求5所述的工業過程監測模型智能推薦方法,其特征在于,所述監測案例增量的更新策略具體包括:
7.根據權利要求5所述的工業過程監測模型智能推薦方法,其特征在于,所述候選模型增量的更新策略具體包括:
8.根據權利要求5所述的工業過程監測模型智能推薦方法,其特征在于,所述推薦節點增量的更新策略具體包括:
9.一種用于實現權利要求1-8中任一項所述的工業過程監測模型智能推薦方法的推薦系統,其特征在于,包括:
10.根據權利要求9所述的推薦系統,其特征在于,所述故障案例覆蓋多種故障類型,包括階躍故障、間歇故障、初期故障、緩變故障、漂移故障、卡澀故障;每個故障案例均包含對應的訓練數據、測試數據以及故障發生時間,其中,訓練數據用于模型庫的模型訓練以及數據集特征向量的構建,測試數據用于根據故障發生時間和評分規則庫評估模型庫中各個模型的性能;
...【技術特征摘要】
1.一種工業過程監測模型智能推薦方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的工業過程監測模型智能推薦方法,其特征在于,所述步驟(1)具體包括:
3.根據權利要求2所述的工業過程監測模型智能推薦方法,其特征在于,所述通用統計特征包括數據集樣本總數量、數據集變量總數m、數據集均值、中位數、標準差、最大值、最小值、四個樣本分位數、四分位距、歸一化均值、歸一化中位數、樣本范圍、樣本基尼系數、絕對中位數偏差、絕對均值偏差、分位數系數離散度、方差系數、處在和之外的異常點數量、處在和之外的異常點數量占比、處在和之外的異常點數量、處在和之外的異常點數量占比、處在1%~99%范圍外的異常點數量、處在1%~99%范圍外的異常點數量占比、處在以外的異常點數量、處在以外的異常點數量占比、各變量稀疏度的均值、各變量稀疏度的最大值、各變量稀疏度的最小值、各變量稀疏度的標準差、各變量稀疏度的偏度、各變量稀疏度的峰度、各變量熵的均值、各變量熵的最大值、各變量熵的最小值、各變量熵的標準差、各變量熵的偏度、各變量熵的峰度、變量間協方差的均值、變量間協方差的最大值、變量間協方差的最小值、變量間協方差的標準差、變量間協方差的偏度、變量間協方差的峰度、變量間相關性的均值、變量間相關性的最大值、變量間相關性的最小值、變量間相關性的標準差、變量間相關性的偏度、變量間相關性的峰度、各變量方差分析p值的均值、各變量方差分析p值的最大值、各變量方差分析p值的最小值、各變...
【專利技術屬性】
技術研發人員:趙春暉,李寶學,李清毅,劉盛輝,朱松強,張國民,紀培棟,
申請(專利權)人:浙江大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。