System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及水質預測,尤其是涉及一種自來水廠出水余氯的自適應預測方法及系統。
技術介紹
1、加氯消毒是保證自來水廠出水余氯達標的關鍵一環,對加氯量的精確調控一直是水廠的重點,加氯量不足會導致出水余氯過低消毒效果變差,加氯量過高則會增加消毒副產物風險,同時增加運行成本。因此,建立可靠的出水余氯預測模型,進而對加氯量進行實時調控,是當前自來水廠亟待解決的難題。然而,自來水廠是典型的時滯時變系統,這要求預測模型除擬合出水余氯與其相關因素(輸入特征)間的非線性關聯外,還需處理指標之間的時間滯后關聯。目前,對于自來水廠關鍵水質參數的預測建模方法上,主要涉及余氯衰減模型等機理模型,支持向量機、線性回歸模型等機器學習模型,傳統模型依托于真實的工藝過程,可以從本質上很好的反映出水余氯與輸入特征之間的關系,但在應用到對于自來水廠的出水余氯的預測過程中,由于在加氯消毒后往往需要較長的反應過程后才能在出水處處檢測到該次加氯調節的影響,存在動態變化的滯后時間間隔,這就使得現有的預測方法不能完全反映輸入輸出之間的關系,預測結果不準確。
2、在中國專利文獻上公開的“一種基于寬度學習網絡的自來水廠的出水余氯預測方法”,其公開號為cn114997486a,公開日期為2022-09-02,包括以下步驟:首先對自來水廠的數據集進行標準化預處理,然后對標準化處理后的自來水廠數據集的輔助變量利用主成分分析方法(pca)方法得到其低維的特征映射,再通過將輔助變量的低維特征映射作為輸入、目標變量作為輸出,最后使用求偽逆的方法訓練寬度學習網絡模型,得到自來水廠
技術實現思路
1、本專利技術是為了克服現有技術中并沒有考慮加氯消毒和其對應的出水余氯濃度存在動態變化的滯后時間間隔,使得最終的出水余氯預測不準確的問題,提供了一種自來水廠出水余氯的自適應預測方法及系統,通過計算出水余氯與其相關輸入特征的滯后時間間隔,并從時間維度對各輸入特征進行重構后輸入模型中進行訓練得到余氯預測模型,在解決出水余氯與輸入特征的時滯特性問題的同時提高了余氯預測的準確性。
2、為了實現上述目的,本專利技術采用以下技術方案:
3、一種自來水廠出水余氯的自適應預測方法,包括:
4、獲取自來水廠的出水余氯和與其相關的影響因素的歷史數據,并進行預處理;
5、計算每個影響因素與出水余氯的滯后時間間隔,并基于計算結果對所有影響因素進行時間維度的數據重構生成歷史數據集;
6、建立預測模型,利用重構后的歷史數據集對預測模型進行訓練得到出水余氯預測模型;
7、利用訓練完成的出水余氯預測模型對出水余氯進行預測。
8、本專利技術中通過計算每個影響因素與出水余氯的滯后時間間隔并在時間維度進行數據重構,繼而采用預測模型對出水余氯進行實時在線預測,具有動態調節、自適應更新的特點,可以作為加氯過程智能調節、出水余氯實時預警等在線操作的基礎;根據每個影響因素的不同滯后時間間隔進行數據重構,可以增強模型的輸入特征與輸出的出水余氯之間的關聯性,在解決了時間滯后問題的同時提高了出水余氯預測模型的預測精度。
9、作為優選,所述進行預處理的過程包括:
10、剔除原始數據中分布在3倍標準差范圍以外的數據樣本;
11、根據缺失值到左右相鄰兩個數據的距離分配權重,并利用線性函數進行填充;
12、通過小波去噪去除噪聲;對完成上述操作的數據進行歸一化處理。
13、本專利技術中在進行數據采集時,由于儀表故障、噪聲干擾或傳輸錯誤等原因會使得原始數據存在大量的干擾數據,因此需要對原始數據先進行預處理后才能用于后續的模型訓練和預測。
14、作為優選,所述進行時間維度的數據重構生成歷史數據集的過程包括:
15、計算出水余氯相比于第i影響因素的滯后時間間隔δti,得到第i影響因素與t時刻出水余氯yt之間的對應關系以同樣的方式獲取其他影響因素與t時刻出水余氯yt的對應關系;
16、基于所有影響因素與出水余氯yt的對應關系重新組合影響因素數據生成歷史數據集。
17、本專利技術中與出水余氯相關的影響因素有很多,在進行選擇時可以根據實際情況進行確定;同時不同的影響因素因為其對出水余氯的影響方式各不相同,所以其和出水余氯之間的滯后時間間隔也可能不同,在這種情況下需要對每個影響因素按照各自的滯后時間間隔進行時間軸上的移動后重新構成新的歷史數據集,使得模型在訓練過程中能夠學習到不同影響因素的滯后特性,從而提高預測精度。
18、作為優選,計算影響因素與出水余氯的滯后時間間隔的過程包括:
19、對出水余氯和影響因素的數據以時間序列形式表示;
20、將其中一個時間序列移動特定的時間步長k后計算兩個時間序列的關聯性;
21、遍歷所有時間步長取值,選擇使兩個時間序列的關聯性最大的時間步長k作為滯后時間間隔。
22、本專利技術中由于影響因素的數據會滯后體現在出水余氯的數據中,也就是使得影響因素的數據需要整體后移一定的滯后時間間隔后才能體現出其與出水余氯的關聯性,基于這種情況來計算滯后時間間隔,相比于現有的余氯衰減模型不需要在線監測大量的水質參數和動力學參數;相比于人為經驗值判斷的方法,能夠考慮量流變化、溫度變化等因素引起的滯后時間間隔動態變化,計算結果更準確能夠提高模型預測精度。
23、作為優選,所述計算兩個時間序列的關聯性的過程為:
24、
25、其中x和y是長度為n的兩個時間序列,和表示這兩個時間序列的均值,k表示兩個時間序列之間滯后的時間步長。
26、本專利技術中采用時間滯后互相關分析方法進行兩個時間序列的關聯性的計算,通過不斷移動第一時序數據,可以得到第一時序數據和第二時序數據之間的互相關性;將同一時刻的偏移量與互相關性數據建立對應曲線,曲線的峰值表明兩個時間序列在某個偏移值處具有最大的相似性,即在對應的滯后時間間隔時關聯性最大。
27、作為優選,所述預測模型采用xgboost模型,不斷向模型中添加決策樹,當訓練完k棵決策樹后預測一個樣本的分數,并將每棵決策樹的分數相加得到樣本的預測值:
28、
29、其中是模型的最終預測值,xi∈rn表示第i個數據點的特征向量,k表示樹的數目,fk是函數空間f中第k棵回歸樹的預測結果,對應樹的結構q與葉子權重w的情況。
30、本專利技術中xgboost模型的核心思想是使用多個弱學習器,并通過逐步優化損失函數來構建一個強學習器,其中弱學習器是簡單的決策樹模型;其學習過程可以理解為生成新的樹擬合前一棵樹的殘差,通過不斷迭代提升模型預測精度,最后綜合每一個本文檔來自技高網...
【技術保護點】
1.一種自來水廠出水余氯的自適應預測方法,其特征在于,包括:
2.根據權利要求1所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,所述進行預處理的過程包括:剔除原始數據中分布在3倍標準差范圍以外的數據樣本;
3.根據權利要求1或2所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,所述進行時間維度的數據重構生成歷史數據集的過程包括:
4.根據權利要求3所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,計算影響因素與出水余氯的滯后時間間隔的過程包括:
5.根據權利要求4所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,所述計算兩個時間序列的關聯性的過程為:
6.根據權利要求1或2或4或5所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,所述預測模型采用XGBoost模型,不斷向模型中添加決策樹,當訓練完k棵決策樹后預測一個樣本的分數,并將每棵決策樹的分數相加得到樣本的預測值:
7.根據權利要求6所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,所述XGBoost模型采用包含有訓
8.根據權利要求7所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,對于預測模型通過決定系數R2和平均絕對百分比誤差MAPE評估模型精度:
9.根據權利要求1或2或4或5或7或8所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,對于出水余氯預測模型進行自適應更新:
10.一種自來水廠出水余氯的自適應預測系統,適用于如權利要求1-9任一項所述的自適應預測方法,其特征在于,包括:
...【技術特征摘要】
1.一種自來水廠出水余氯的自適應預測方法,其特征在于,包括:
2.根據權利要求1所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,所述進行預處理的過程包括:剔除原始數據中分布在3倍標準差范圍以外的數據樣本;
3.根據權利要求1或2所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,所述進行時間維度的數據重構生成歷史數據集的過程包括:
4.根據權利要求3所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,計算影響因素與出水余氯的滯后時間間隔的過程包括:
5.根據權利要求4所述的一種自來水廠出水余氯的自適應預測方法,其特征在于,所述計算兩個時間序列的關聯性的過程為:
6.根據權利要求1或2或4或5所述的一種自來水廠出水余氯的自適應預測方法,其特征...
【專利技術屬性】
技術研發人員:沈寅杰,馮寬亮,何東,蔡艷偉,
申請(專利權)人:浙江中控信息產業股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。