System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及質譜數據處理,具體涉及一種基于數據孿生的質譜檢測方法及系統。
技術介紹
1、質譜檢測是一種廣泛應用于化學分析、環境監測、生物醫藥等領域的重要技術。現有質譜檢測系統的數據處理和分析存在數據量大、處理復雜等問題。需要投入大量的人力、物力或財力,局限性相對較大。為此,亟需提供一種實時、精確、高效的質譜數據分析方法,以提升質譜檢測數據的利用效率和分析效果。
技術實現思路
1、針對上述現有技術存在的問題,本專利技術提供了一種基于數據孿生的質譜檢測方法及系統,該技術方案如下:
2、第一方面,提供了一種基于數據孿生的質譜檢測方法,包括如下步驟:
3、通過質譜檢測設備獲取樣品的原始質譜數據;
4、對原始質譜數據進行多階段智能化的質譜數據預處理;
5、使用機器學習算法對處理后的質譜數據進行訓練,構建數據孿生模型,所述數據孿生模型用于獲取質譜分析結果;
6、針對新的質譜數據,輸入到訓練完成的所述數據孿生模型,獲取質譜分析結果。
7、在一些實施方式中,所述對原始質譜數據進行多階段智能化的質譜數據預處理,包括:
8、通過小波變換和自適應濾波對原始質譜數據進行多層次、精細化的去噪處理;
9、通過雙重標準化和智能校正方法,消除儀器和樣品間的差異。
10、在一些實施方式中,所述通過小波變換和自適應濾波對原始質譜數據進行多層次、精細化的去噪處理,包括:
11、采用小波變換對原始質譜
12、針對第一預處理數據,采用最小均方自適應濾波算法進行處理,得到第二預處理數據;所述最小均方自適應濾波算法中,濾波器各個權值的更新公式為:w(n+1)=w(n)+μe(n)x(n),其中,w(n)是濾波器權重,μ是學習率,e(n)是誤差,x(n)?是輸入信號。
13、在一些實施方式中,所述通過雙重標準化和智能校正方法,消除儀器和樣品間的差異,包括:利用預先訓練完成的模型自動識別和校正數據中的異常值,具體包括:
14、對質譜數據進行全局標準化和局部標準化,基于雙重標準化數據綜合確定質譜數據的標準化結果;
15、利用智能校正進一步調整標準化后的數據,消除系統性誤差和儀器漂移影響;
16、對質譜數據的標準化處理方法,包括:
17、針對不同樣品或不同組的質譜數據分別進行局部標準化;針對所有樣品或者所有組的質譜數據進行全局標準化,得到對應于同一個樣品或者同一個組的質譜數據的局部標準化數據和全局標準化數據,所述標準化方法為基于當前數據與數據最小值的差值和數據最大最小值差值的占比計算得到;
18、分析同一個樣品或者同一個組的質譜數據的局部標準化數據和全局標準化數據的差異,得到每個樣品或者每個組的質譜數據的雙標準化數據差異數據;
19、基于所有樣品或者所有組的質譜數據對應的雙標準化數據差異數據的統計分布數據,確定每個樣品或組的質譜數據的標準化結果。
20、在一些實施方式中,所述數據孿生模型包括時空特征提取模塊、頻域特征計算單元和機器學習算法集成模塊,其中時空特征提取模塊、頻域特征計算單元并聯同步接收輸入的質譜數據,時空特征提取模塊、頻域特征計算單元并聯后級聯所述機器學習算法集成模塊;
21、所述數據孿生模型的訓練過程包括:
22、對輸入的質譜數據采用時空特征提取模塊提取時空特征,同時采用頻域特征計算單元通過快速傅里葉變換fft提取頻域特征;所述時空特征提取模塊中的網絡模型參數待訓練,在數據孿生模型的訓練過程不斷迭代更新,頻域特征計算單元不含待訓練參數;
23、將質譜數據的時空特征和頻域特征concat連接組成質譜特征;
24、將質譜特征輸入機器學習算法集成模塊進行綜合決策,獲得質譜數據分析結果,機器學習算法集成模塊中網絡模型參數待訓練,在數據孿生模型的訓練過程不斷迭代更新。
25、在一些實施方式中,所述數據孿生模型中,所述機器學習算法集成模塊中包括至少一個機器學習模型、權重分配模型;至少一個機器學習模型并聯同步接收機器學習算法集成模塊的輸入數據,至少一個機器學習模型并聯后級聯所述權重分配模型;每個所述機器學習模型的網絡模型參數待訓練,權重分配模型的網絡模型參數待訓練,在數據孿生模型的訓練過程不斷迭代更新。
26、在一些實施方式中,在數據孿生模型的訓練過程中,所述機器學習算法集成模塊中,執行如下過程:
27、獲取各個機器學習模型輸出的質譜數據分析結果;
28、基于各個輸出的質譜數據分析結果計算與理論上的質譜數據分析結果的誤差;基于質譜數據分析結果的所述誤差反向更新各個機器學習模型的網絡模型參數;
29、基于各個機器學習模型對應的誤差計算各個機器學習模型的權重理論值,獲得面向集成模塊中所有機器學習模型的權重向量理論值;
30、將各個機器學習模型輸出的質譜數據分析結果輸入到權重分配模型,獲得權重分配模型輸出的權重向量;
31、基于輸出的權重向量和所述權重向量理論值的誤差反向更新權重分配模型的網絡模型參數。
32、在一些實施方式中,在數據孿生模型的訓練過程中,所述機器學習算法集成模塊中,執行如下過程:
33、獲取各個機器學習模型輸出的質譜數據分析結果;
34、基于各個輸出的質譜數據分析結果計算與理論上的質譜數據分析結果的誤差;基于質譜數據分析結果的所述誤差反向更新各個機器學習模型的網絡模型參數;
35、將各個機器學習模型輸出的質譜數據分析結果輸入到權重分配模型進行賦權融合,輸出匯總質譜數據分析結果;基于匯總質譜數據分析結果和理論上的質譜數據分析結果的誤差反向更新權重分配模型的網絡模型參數。
36、在一些實施方式中,所述時空特征提取模塊基于卷積神經網絡cnn和長短期記憶網絡lstm級聯構成;時空特征提取模塊的數據處理步驟包括:質譜數據經數據輸入層輸入,進入卷積層提取質譜數據局部時空特征,進入池化層進行特征降維,進入lstm層提取質譜數據時序特征,經過全連接層生成質譜數據的特征向量,經過輸出層輸出;
37、所述頻域特征包括:頻率分量、功率譜密度、頻譜熵、中心頻率、帶寬、諧波成分、小波系數、瞬時頻率。
38、第二方面,提供了一種基于數據孿生的質譜檢測系統,該系統包括:
39、原始數據獲取單元,用于通過質譜檢測設備獲取樣品的原始質譜數據;
40、預處理單元,用于對原始質譜數據進行多階段智能化的質譜數據預處理;
41、模型訓練單元,用于使用機器學習算法對處理后的質譜數據進行訓練,構建數據孿生模型,所述數據孿生模型用于獲取質譜分析結果;
42、數據分析單元,用于針對新的質譜數據,輸入到訓練完成的所述數據孿生模型,獲取質譜分析結果。
43、第三方面,提供了一種電子本文檔來自技高網...
【技術保護點】
1.一種基于數據孿生的質譜檢測方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的基于數據孿生的質譜檢測方法,其特征在于,所述對原始質譜數據進行多階段智能化的質譜數據預處理,包括:
3.根據權利要求2所述的基于數據孿生的質譜檢測方法,其特征在于,所述通過小波變換和自適應濾波對原始質譜數據進行多層次、精細化的去噪處理,包括:
4.根據權利要求2所述的基于數據孿生的質譜檢測方法,其特征在于,所述通過雙重標準化和智能校正方法,消除儀器和樣品間的差異,包括:利用預先訓練完成的模型自動識別和校正數據中的異常值,具體包括:
5.根據權利要求1所述的基于數據孿生的質譜檢測方法,其特征在于,所述數據孿生模型包括時空特征提取模塊、頻域特征計算單元和機器學習算法集成模塊,其中時空特征提取模塊、頻域特征計算單元并聯同步接收輸入的質譜數據,時空特征提取模塊、頻域特征計算單元并聯后級聯所述機器學習算法集成模塊;
6.根據權利要求5所述的基于數據孿生的質譜檢測方法,其特征在于,所述數據孿生模型中,所述機器學習算法集成模塊中包括至少一個機器學習
7.根據權利要求6所述的基于數據孿生的質譜檢測方法,其特征在于,在數據孿生模型的訓練過程中,所述機器學習算法集成模塊中,執行如下過程:
8.根據權利要求6所述的基于數據孿生的質譜檢測方法,其特征在于,在數據孿生模型的訓練過程中,所述機器學習算法集成模塊中,執行如下過程:
9.根據權利要求5所述的基于數據孿生的質譜檢測方法,其特征在于,
10.一種基于數據孿生的質譜檢測系統,其特征在于,包括:
...【技術特征摘要】
1.一種基于數據孿生的質譜檢測方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的基于數據孿生的質譜檢測方法,其特征在于,所述對原始質譜數據進行多階段智能化的質譜數據預處理,包括:
3.根據權利要求2所述的基于數據孿生的質譜檢測方法,其特征在于,所述通過小波變換和自適應濾波對原始質譜數據進行多層次、精細化的去噪處理,包括:
4.根據權利要求2所述的基于數據孿生的質譜檢測方法,其特征在于,所述通過雙重標準化和智能校正方法,消除儀器和樣品間的差異,包括:利用預先訓練完成的模型自動識別和校正數據中的異常值,具體包括:
5.根據權利要求1所述的基于數據孿生的質譜檢測方法,其特征在于,所述數據孿生模型包括時空特征提取模塊、頻域特征計算單元和機器學習算法集成模塊,其中時空特征提取模塊、頻域特征計算單元并聯同步接收輸入的質譜數據,時空特征提取模塊、頻域特征計算單元并聯后級聯所述機器學習算法集...
【專利技術屬性】
技術研發人員:王旭,趙猛,夏浩,
申請(專利權)人:合肥譜佳醫學檢驗實驗室有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。