System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算機數據處理,特別涉及基于機器學習算法與自動尋優算法的廢水智能監控方法。
技術介紹
1、隨著城市人口的增多和工業化水平的進步,水體富營養化問題加劇,廢水問題日漸突出,氨態氮是水體富營養化的重要污染物質,通常采用厭氧氨氧化方法分去除廢水中的氨態氮。廢水中的游離氨(fa)和游離亞硝酸(fna)對于污水處理廠中的微生物群落組成會產生改變,影響微生物對水質的處理效果,因此對于廢水中游離氨和游離亞硝酸的準確測量有著現實意義。而兩者的濃度通常通過人工對于出水氨氮和亞硝氮濃度的測量,進而通過公式進行計算,所需時間長,成本高;運營人員通常每隔一段時間測定進出水水質指標,對于其測定過程比較漫長,其監測數據具有一定的滯后性,難以及時預知或發現其導致的系統異常;且水質受諸多因素的影響,導致水質呈現出高度的非線性,波動性和不確定性特征,使預測系統異常變得困難。
2、近年來,機器學習始終在不斷發展完善,利用機器學習算法預測污水處理廠進出水水質的技術已經受到廣大科研工作者的關注。機器學習算法在解決如廢水處理水質等預測問題時具有很高的點預測精度,但手動調整模型超參數十分費時費力。因此,如何使機器學習模型克服手動調整超參數的不足是亟需解決的理論和實際工程問題。
技術實現思路
1、本專利技術目的之一在于提供了基于機器學習算法與自動尋優算法的廢水智能監控方法,旨在解決現有的機器學習模型不能自動調整超參數的技術問題。
2、本專利技術實施例提供的基于機器學習算法與自動尋優算法的廢水
3、選取廢水處理廠的廢水處理單元在預設時段內的監測數據,并作為機器學習的數據集;
4、將數據集劃分成訓練集與測試集,并對訓練集進行預處理;
5、基于預處理后的訓練集,對多種機器學習模型進行訓練,在訓練過程中,基于自動尋優tpe,訓練每種機器學習模型的最優模型;
6、基于測試集,確定每種機器學習模型的最優模型的點預測結果;
7、基于不同機器學習模型的最優模型的點預測結果,確定廢水預測模型;
8、基于廢水預測模型,對廢水處理單元進行廢水預測。
9、可選地,所述將數據集劃分成訓練集與測試集,包括:
10、對數據集按照8:2的比例進行劃分,獲得訓練集與測試集。
11、可選地,所述對訓練集進行預處理,包括:
12、對訓練集進行歸一化處理。
13、可選地,所述多種機器學習模型包括:xgboost模型、隨機森林模型、支持向量機模型和人工神經網絡模型。
14、可選地,所述基于預處理后的訓練集,對多種機器學習模型進行訓練,在訓練過程中,基于自動尋優tpe,訓練每種機器學習模型的最優模型,包括:
15、設置機器學習模型的多種超參數以及各種超參數的尋優范圍;其中,所述多個超參數包括:最大深度d、學習率l、子采樣s、正則化控制項λ;
16、設置機器學習模型的弱學習器為gbtree,機器學習模型的損失函數為均方誤差rmse;
17、訓練機器學習模型:對于帶有n個輸入樣本和m個輸出的預處理后的訓練集d={(xi,yi)}(|d|=n,xi∈rm,yi∈r),通過k個加性函數來預測輸出:
18、
19、其中,為回歸樹空間,即cart樹;q表示將示例映射到相應葉索引的每棵樹的結構;t是樹中葉子結點的個數;每個fk對應于一個獨立的樹結構q和葉子權重w;wi表示第i個葉子上的分數;
20、在樹模型中添加正則化目標:
21、
22、其中,l用來預測和目標yi之間的差值,第二項中ω限制模型的復雜性,即回歸樹函數;通過最小化該目標函數從而訓練得到更好的xgboost預測模型;
23、將上述過程依次迭代直到損失收斂即為訓練完成;
24、完成一次訓練后,tpe會根據輸出結果與輸出精度調整超參數,直到達到設定的訓練次數后,自動尋優結束,輸出最優模型。
25、可選地,所述基于測試集,確定每種機器學習模型的最優模型的點預測結果,包括:
26、通過如下公式計算每種機器學習模型的最優模型的點預測結果:
27、
28、其中,r2為決定系數,rmse為均方根誤差,mape為平均絕對百分比誤差,yi為第i個觀測值,為第i個觀測值的平均值,為第i個預測值,n為預測樣本個數。
29、可選地,所述廢水預測模型的輸入變量包含進水ph值、氧化還原電位orp、總氮負荷nlr、回流比r、出水氨氮nh4+-n及硝氮nh3--n;輸出變量包含出水游離氨濃度fa及游離亞硝酸濃度fna。
30、本專利技術提供一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現上述任一項所述的方法。
31、本專利技術的有益效果是:
32、本專利技術提供一種基于機器學習算法與自動尋優算法的廢水處理智能監控方法,能夠實現廢水水質的準確預測。根據廢水處理工藝中各指標的變化,準確預測出水中游離氨和游離亞硝酸,為運營人員節省了人工測量的成本,同時給出點預測結果,輸出結果具有良好的可信性。
33、本專利技術針對研究人員需要手動調整機器學習超參數的痛點,引入了樹狀結構parzen估計方法tpe,對機器學習超參數進行自動尋優,使機器學習模型達到最優狀態。此方法既為研究人員省去手動調整超參數的時間,也能有效提高模型預測精度。
34、本專利技術的其它特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本專利技術而了解。本專利技術的目的和其他優點可通過在所寫的說明書以及附圖中所特別指出的結構來實現和獲得。
35、下面通過附圖和實施例,對本專利技術的技術方案做進一步的詳細描述。
本文檔來自技高網...【技術保護點】
1.基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,包括:
2.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述將數據集劃分成訓練集與測試集,包括:
3.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述對訓練集進行預處理,包括:
4.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述多種機器學習模型包括:XGBoost模型、隨機森林模型、支持向量機模型和人工神經網絡模型。
5.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述基于預處理后的訓練集,對多種機器學習模型進行訓練,在訓練過程中,基于自動尋優TPE,訓練每種機器學習模型的最優模型,包括:
6.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述基于測試集,確定每種機器學習模型的最優模型的點預測結果,包括:
7.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能
8.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述的方法。
...【技術特征摘要】
1.基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,包括:
2.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述將數據集劃分成訓練集與測試集,包括:
3.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述對訓練集進行預處理,包括:
4.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述多種機器學習模型包括:xgboost模型、隨機森林模型、支持向量機模型和人工神經網絡模型。
5.如權利要求1所述的基于機器學習算法與自動尋優算法的廢水智能監控方法,其特征在于,所述基于預處理后的訓練集,對多種機器學習模型進行訓練...
【專利技術屬性】
技術研發人員:陳樹龍,黎志偉,黃祖安,黃明智,洪逸群,
申請(專利權)人:江門公用能源環保有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。