System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于水利模型,具體涉及一種基于規則配置和ai學習的水利行業模擬仿真數據生成方法、工具、設備及其介質。
技術介紹
1、隨著水利工程規模的擴大和復雜性的增加,對水利數據的需求日益增長。水利工程的安全運行關系到人民群眾的生命財產安全和社會的穩定。通過對水利工程的實時監測和數據分析,可以及時發現工程的安全隱患,采取有效的措施進行預防和治理。
2、水利數據用于工程設計、建設、管理,還用于政策制定、災害預警、水資源調度等多個方面。但目前水利行業的數據生產主要依賴于實際監測和人工模擬。實際監測受限于設備成本和地理環境的限制,往往難以覆蓋所有需要的數據點;而人工模擬仿真數據主要面向通用領域,如何實現水利行業模擬仿真數據的生成仍有待研究。同時,模擬的數據難以應用于實際的項目應用場所中。
技術實現思路
1、為解決以上問題,本專利技術的目的是提供一種基于規則配置和ai學習的水利行業模擬仿真數據生成方法,同時還公開了其工具、設備和介質。本專利技術通過規則配置和ai對歷史數據的學習,能夠生產出符合水利行業當前業務規則的模擬仿真數據,為系統開發提供脫離生產環境的開發與測試環境,確保生產數據的安全性,提高系統開發效率與測試準確性。同時,模擬的數據可應用于實際的項目應用場景中。
2、一種基于規則配置和ai學習的水利行業模擬仿真數據生成方法,包括如下步驟:
3、s1、系統化收集并上傳數據,數據包括必需的歷史數據及其相關輔助數據;
4、s2、自定義數據生成規則
5、s3、數據預處理;
6、s4、構建lstm(長短期記憶)模型;
7、s5、殘差處理;
8、s6、構建變分自編碼器(variational?autoencoder,?vae)。
9、本專利技術的方法通過基于規則配置和ai學習,實現水利行業模擬仿真數據,并對其方法進行進一步的優化改進。
10、進一步的,s3數據預處理的方法包括:
11、s31、采用多項式插值技術處理歷史數據中的缺失值,并利用箱形圖統計方法對異常值進行識別,隨后通過多項式插值對異常數據進行調整;
12、多項式插值公式:
13、
14、其中,是插值多項式的系數;
15、s32、將歷史數據中的日期時間數據轉換為秒,利用正弦和余弦變換捕捉日期時間數據“一天中的時間”、“一年中的時間”信號;
16、日期時間正余弦變換公式:
17、
18、
19、其中,?timestamps是對應原始日期時間數據的unix時間戳;period?是周期,它可以是“一天”或“一年”;
20、s33、加載處理后的歷史數據,將其按7:2:1的比例劃分為訓練集、驗證集、測試集;
21、s34、對訓練集、驗證集、測試集數據進行標準化處理;
22、s35、通過定義輸入窗口的寬度(用于預測的時間步)、標簽窗口的寬度(需要預測的未來時間步數)、輸入和標簽的時間步數偏移、訓練集數據、驗證集數據、測試集數據、目標標簽名稱來定義一個數據窗口;
23、s36、將訓練、驗證、測試集轉變為序列數據集,并將數據集中的每個窗口分割輸入和標簽。
24、進一步的,s4構建lstm(長短期記憶)模型的具體方法為:
25、s41、定義lstm層的數量及每層lstm中神經單元數量、輸出數據的維度等信息。
26、lstm單元的公式:
27、
28、其中,分別是遺忘門、輸入門、新的候選細胞狀態、細胞狀態、輸出門和隱藏狀態;
29、s42、定義全連接層的數量及每層全連接中神經元數量、激活函數,初始化全連接層的權重為零;
30、全連接層公式:
31、
32、其中,y是輸出,w是權重矩陣,b是偏置向量,σ是激活函數;
33、s43、定義reshape層,將輸出重塑為[輸出步長、特征數量]的形狀;
34、s44、定義模型的損失函數(均方誤差、交叉熵損失)、優化器、周期等信息后,利用構建好數據集窗口進行模型訓練;
35、均方誤差公式:
36、
37、交叉熵損失公式:
38、
39、其中,yi是真實值(標簽),是預測值(標簽),n是數據點的數量;
40、s45、利用訓練好的lstm模型對模型的訓練集、驗證集、測試集進行預測,得到預測值并計算殘差。
41、進一步的,s5殘差處理的具體方法為:
42、s51、利用單位根檢驗(adf檢驗)、box-ljung檢驗等方法驗證殘差是一個白噪聲序列。
43、單位根檢驗公式:
44、
45、其中,yt是序列;δ表示一階差分;α是常數項;β是時間趨勢系數;t是時間變量;p是滯后階數;γi是相應滯后項的系數;?t是誤差項;
46、box-ljung檢驗的公式:
47、
48、其中,p?是檢驗的滯后階數;n是序列的長度;是第k階滯后自相關系數;
49、s52、對于非白噪聲序列,采用高斯回歸模型進行處理,直至殘差滿足白噪聲標準;
50、
51、
52、其中,y是因變量;x1,x2,…,xk是自變量;k(x,y)是徑向基核函數;γ是徑向基核的參數;是點?x和?y之間的歐幾里得距離;
53、s53、結合模型預測值和高斯回歸模型殘差預測值,生成一組新的預測值,對達到預定精度要求的預測值認定為真實值,反之則視為干擾數據。
54、進一步的,s6構建變分自編碼器(variational?autoencoder,?vae)的具體方法為:
55、s61、定義vae編碼器:明確輸入數據的維度,設定合適的隱藏層維度,定義潛在空間的表示維度,并選擇適當的激活函數以增強模型的非線性學習能力。
56、vae編碼器公式:
57、
58、其中,z?是潛在空間的表示,μ?和?σ?是編碼器輸出的均值和標準差,?是從標準正態分布中采樣的隨機變量。
59、s62、定義vae解碼器:確定輸出數據的維度,配置相應的隱藏層結構,并選用恰當的激活函數以恢復數據至原始空間。
60、vae編碼器公式:
61、
62、其中,是重構的輸入數據,g是解碼器函數。
63、s63、設定vae模型訓練的輪數、每次訓練時使用的樣本數量、輸出信息的詳細程度、模型優化器的選擇。
64、s64、根據用戶設定規則(數據范圍)重構損失函數(重構損失、kl散度)。
65、
66、
67、
68、?
69、其本文檔來自技高網...
【技術保護點】
1.一種基于規則配置和AI學習的水利行業模擬仿真數據生成方法,其特征在于:包括如下步驟:
2.如權利要求1所述的方法,其特征在于:S3數據預處理包括以下步驟:
3.如權利要求1所述的方法,其特征在于:S4構建LSTM模型的具體方法為:
4.如權利要求1所述的方法,其特征在于:S5殘差處理的具體方法為:
5.如權利要求1所述的方法,其特征在于:S6構建變分自編碼器的具體方法為:
6.一種水利行業模擬仿真數據生成工具,其特征在于:包括:
7.一種電子設備,其特征在于:包括處理器、存儲器以及存儲在所述存儲器中且被配置為由所述處理器執行的計算機程序,其中處理器被配置為執行以實現上述權利要求1-5所述的基于規則配置和AI學習的水利行業模擬仿真數據生成方法。
8.一種非臨時性計算機可讀存儲介質,其特征在于:當存儲介質中的計算機程序由電子設備的處理器執行時,使得電子設備能夠執行實現上述權利要求1-5所述的基于規則配置和AI學習的水利行業模擬仿真數據生成方法。
【技術特征摘要】
1.一種基于規則配置和ai學習的水利行業模擬仿真數據生成方法,其特征在于:包括如下步驟:
2.如權利要求1所述的方法,其特征在于:s3數據預處理包括以下步驟:
3.如權利要求1所述的方法,其特征在于:s4構建lstm模型的具體方法為:
4.如權利要求1所述的方法,其特征在于:s5殘差處理的具體方法為:
5.如權利要求1所述的方法,其特征在于:s6構建變分自編碼器的具體方法為:
6.一種水利行業模擬仿真數據生...
【專利技術屬性】
技術研發人員:朱浩,付萬超,顧紀銘,黃振山,
申請(專利權)人:江蘇水科尚禹能源技術研究院有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。