System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及水體數據監測,具體涉及一種稻田水體數據在線測量方法、系統及介質。
技術介紹
1、稻田水體數據監測在農業生產中扮演著舉足輕重的角色。它不僅關乎水稻的生長發育,還直接影響到稻田生態系統的平衡與穩定。如ph值和溶解氧(dissolved?oxygen,do)測量,ph值作為衡量稻田水體酸堿度的關鍵指標,而溶解氧是衡量稻田水體健康狀態和自凈能力的重要指標,稻田水體的ph值以及溶解氧含量直接影響水生生物的生存狀態,進而影響稻田生態系統的平衡。
2、拉曼光譜是一種有效的分析工具,用于確定樣品的性質和基于分子振動和旋轉信息評估其組分的質量,能夠以高靈敏度和快速的速度同步測量多個參數。重要的是,它不需要額外的試劑或樣品制備,這使它成為在稻田水體數據測量的一個方便和環保的選擇。
3、但是稻田水中包含眾多未知的無機和有機物質,待測量物質自身的拉曼信號確實遠遠小于這些未知物質的拉曼信號以及其激發的熒光干擾和其他未知的來自環境的眾多干擾。所以,建立拉曼測量模型的時候,需要使用眾多的去噪方法、特征提取方法、回歸方法進行排列測試,以期待獲得針對待測量樣本的最好的處理手段組合,這是個需要技巧和耗費精力的過程,其精確性也無法保證。
技術實現思路
1、為解決上述問題,本專利技術提供一種稻田水體數據在線測量方法,該方法通過對拉曼關鍵特征的噪聲去除,以及依據shap值篩選出顯著關鍵特征,所提取顯著關鍵特征變量與待測量目標關聯顯著,無需使用眾多的去噪方法、特征提取方法、回歸方法進行排
2、為實現上述目的,本專利技術提供了如下的技術方案。
3、本專利技術提供一種稻田水體數據在線測量方法,包括以下步驟:
4、確定待測水體數據類型;獲取水體拉曼光譜數據集以及對應的波數序列;
5、確定與待測水體數據類型相關的物質分子,將物質分子對入射光所產生的散射頻移的特征作為關鍵特征,并依據波數序列確定關鍵特征在拉曼光譜數據集的位置,構建關鍵特征序列;
6、識別拉曼數據序列的局部拐點,構建關鍵候選特征序列;通過計算關鍵候選特征序列與關鍵特征的距離平均變異系數,將平均變異系數大于1的關鍵候選特征篩除,完成噪聲剔除,并獲得新增關鍵特征序列;
7、構建xgboost測量模型,依據特定樣本獲得通過xgboost測量模型所測量的待測水體數據類型預測值計算shap值,根據shap值對各篩選后的關鍵特征進行標簽顯著性分析,獲得若干個顯著關鍵特征;
8、提取待測水體的拉曼光譜數據的顯著關鍵特征作為輸入,通過xgboost測量模型獲得水體數據的預測結果。
9、優選地,還包括通過optuna算法優化xgboost測量模型的超參數,獲得優化后的xgboost測量模型;輸入待測水體的拉曼光譜數據,通過優化后的xgboost測量模型獲得水體數據測量目標的預測結果。
10、優選地,所述構建關鍵特征序列,包括以下步驟:
11、獲取水體拉曼光譜數據集d以及對應的波數序列w,其中,拉曼數據集d包含n個數據,表示為d=[d1,d2,...,dn];波數序列w則是在固定波數內間隔收集的實值序列,表示為w=[w1,w2,...,wn];
12、確定待測水體數據類型相關的物質分子,計算物質分子的二維化學結構,并形成物質分子構型作為初始幾何數據;
13、通過密度泛函理論方法和基集對物質分子構型進行優化,對計算出的諧波數的高估進行校正,獲得物質分子優化后的幾何參數;
14、基于優化后的幾何參數生成理論拉曼光譜,確定關鍵特征;
15、根據理論關鍵特征構建關鍵特征序列:
16、
17、其中,ka+m為關鍵特征的強度,wa+m為關鍵特征在d中的位置,1≤a≤n,1≤a+j-1≤n,0≤m≤j-1。
18、優選地,所述關鍵特征的篩選,包括以下步驟:
19、篩選獲得拉曼光譜序列的局部拐點作為關鍵候選特征:
20、
21、其中,kcb+q為關鍵候選特征的強度,wcb+q為關鍵候選特征在d中的位置,1≤b≤n,1≤b+p-1≤n,0≤q≤p-1。
22、計算所有樣本中某個關鍵候選特征i與所有關鍵數據的距離:
23、
24、確定平均距離:
25、
26、其中,s為樣本數,b≤i≤b+p-1。
27、確定候選關鍵特征kcb+q的變異系數:
28、
29、將平均變異系數大于1的關鍵候選特征篩除,獲得f個關鍵特征
30、
31、優選地,所述xgboost測量模型基于tree?shap分析,獲得shap值。
32、優選地,還包括在采用xgboost測量模型進行測量前,通過多項式擬合去除拉曼光譜數據的基線,獲取去噪后的拉曼光譜數據用于模型的預測。
33、本專利技術還提供一種稻田水體數據在線測量系統,所述系統包括:
34、處理器;
35、存儲器,其上存儲有可在所述處理器上運行的計算機程序;
36、其中,所述計算機程序被所述處理器執行時實現所述的稻田水體數據在線測量方法的步驟。
37、本專利技術還提供一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有數據處理程序,所述數據處理程序被處理器執行時實現所述的稻田水體數據在線測量方法的步驟。
38、本專利技術的有益效果:
39、本專利技術提出了一種稻田水體數據在線測量方法、系統及介質,該專利技術通過對拉曼關鍵特征的噪聲去除,以及依據shap值篩選出顯著關鍵特征,所提取顯著關鍵特征變量與待測量目標關聯顯著,無需使用眾多的去噪方法、特征提取方法、回歸方法進行排列測試,有效減少模型構建時間并提升目標數據測量的準確性。該專利技術采用optuna算法優化xgboost測量模型,獲得了與經典模型相當甚至更為優秀的測量效果,所構建的模型具有非常優秀的魯棒性。
本文檔來自技高網...【技術保護點】
1.一種稻田水體數據在線測量方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的稻田水體數據在線測量方法,其特征在于,還包括通過Optuna算法優化XGBoost測量模型的超參數,獲得優化后的XGBoost測量模型;輸入待測水體的拉曼光譜數據,通過優化后的XGBoost測量模型獲得水體數據測量目標的預測結果。
3.根據權利要求1所述的稻田水體數據在線測量方法,其特征在于,所述構建關鍵特征序列,包括以下步驟:
4.根據權利要求3所述的稻田水體數據在線測量方法,其特征在于,所述關鍵特征的篩選,包括以下步驟:
5.根據權利要求1所述的稻田水體數據在線測量方法,其特征在于,所述XGBoost測量模型基于Tree?SHAP分析,獲得SHAP值。
6.根據權利要求1所述的稻田水體數據在線測量方法,其特征在于,還包括在采用XGBoost測量模型進行測量前,通過多項式擬合去除拉曼光譜數據的基線,獲取去噪后的拉曼光譜數據用于模型的預測。
7.一種稻田水體數據在線測量系統,其特征在于,所述系統包括:
8.一種計
...【技術特征摘要】
1.一種稻田水體數據在線測量方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的稻田水體數據在線測量方法,其特征在于,還包括通過optuna算法優化xgboost測量模型的超參數,獲得優化后的xgboost測量模型;輸入待測水體的拉曼光譜數據,通過優化后的xgboost測量模型獲得水體數據測量目標的預測結果。
3.根據權利要求1所述的稻田水體數據在線測量方法,其特征在于,所述構建關鍵特征序列,包括以下步驟:
4.根據權利要求3所述的稻田水體數據在線測量方法,其特征在于,所述關鍵特征的篩選,包括以下步驟:
5.根據權利要求1...
【專利技術屬性】
技術研發人員:翟萱,趙肖宇,廖江城,隋雨秱,羅倩,王福麗,
申請(專利權)人:黑龍江八一農墾大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。