本發明專利技術公開了一種基于增量主成份分析的牛奶凝結過程實時監測方法,它是在牛奶凝結過程中的近紅外光譜數據基礎上,利用聚類方法將數據聚類到多個窗口中,然后使用增量主成份分析方法對窗口內數據進行降維,而且當后續的批次數據加入窗口內時,可以通過新增加的樣本數據來修正原來的數據,從而可以對窗口內的特征值和特征向量進行持續的更新,最終動態窗口中的特征數據將精確反映出牛奶凝結過程。本發明專利技術的方法可以對近紅外光譜數據進行更為可靠的數據分析,最終實現了對牛奶凝結過程的精準監測。通過反復試驗驗證,本發明專利技術的方法在對牛奶凝結過程進行檢測時,準確率高達90%以上,從而可以用于更高質量奶酪產品的生產。
【技術實現步驟摘要】
本專利技術涉及一種牛奶凝結過程實時監測方法,特別涉及一種基于增量主成份分析 的牛奶凝結過程實時監測方法。
技術介紹
牛奶凝結用于制作奶酪的步驟是通過切割形成乳凝膠,所切割的時間最終影響奶 酪的產量和品質。如果切割的時間太早導致產量的損失,切割的時間太晚導致得到高水分 的奶酪。現在的奶酪乳制品制作中,工廠操作員主要是根據他們的工作經驗手工切割牛奶 凝結形成的乳凝膠,不僅成本高還帶有主觀因素,這阻礙了流程的自動化和影響了工作效 率。因此,我們有必要優化一種確定切割時間的自動化方法。 牛奶凝乳酶誘導凝膠是需要經歷三個基本階段: (1)初始酶水解,J-酪蛋白將改變其酪蛋白膠束,最終形成副酪蛋白。 ⑵副酪蛋白的聚合,其中聚合速率取決于自由副酪蛋白的濃度,意味著這一階段 是依賴于速率和第J酪蛋白水解的程度; (3)凝膠過程,形成聚合物網絡聚合膠束鏈,也稱為凝膠固化。過度之間的階段,不 易察覺,因為頭部和尾部連續的階段在一定程度上是重疊的。
技術實現思路
本專利技術的目的在于,提供一種基于增量主成份分析的牛奶凝結過程實時監測方 法。它可以精確檢測牛奶凝結過程中主要成分的變化,從而實現牛奶凝結過程的實時監測, 以用于作為切割乳凝膠的時間標準,進而提高奶酪的產量和品質。 本專利技術的技術方案:,包括以 下步驟: SI.采集多個批次的牛奶凝結過程中各個時間點的近紅外光譜數據作為原始數 據; S2.對原始數據進行標準化的預處理,得到多個批次的標準化數據; S3.通過聚類算法將第一個批次的標準化數據進行聚類操作;,生成多個聚類,并 將這些聚類標識為不同的窗口; S4.對每個窗口中的標準化原始數據進行主成份分析(常規主成份分析方法),得 到每個窗口內的數據載荷和數據對應的主成份得分; S5.根據時間點的對應關系,將對下一個批次的標準化數據增加到各個窗口中,并 使用增量主成份分析方法對窗口中的新增數據進行修正以及預測它們的主成份得分,并形 成當前窗口的數據特征; S6.對剩余批次標準化數據逐個重復步驟S5 ; S7.采集待監測的牛奶凝結過程中的近紅外光譜實時數據,并以步驟S5相同的方 法將近紅外光譜實時數據新增到窗口中,通過觀察每個窗口內近紅外光譜數據的主成份得 分來判斷牛奶凝結處于哪個階段(通過窗口去實現觀察)。 上述的中,所述步驟S2的預 處理使用標準化函數,即 前述的基于增重王成份分機的午奶凝結過程實時監測方法中,所述步驟S3中采 用歐式距離作為聚類的指標。多維歐式距離d計算公式為 其中Χι1代表第一個點的第i維坐標,X 12代表第二個點的的第i維坐標。的第1 維坐標,X12代表X 12的第2維坐標,d代表多維空間的點點之間的幾何距離。前述的基于增 量主成份分析的牛奶凝結過程實時監測方法中,所述步驟7中每個窗口內的數據特征包括 窗口內數據的個數、窗口內數據的主成份載荷、主成份的得分及得分所對應的時間點。 前述的中,所述步驟S5中,當 下一個批次的標準化原始數據中有不符合加入已有窗口的條件的數據,則建立新的窗口, 并將這些數據放入新建的窗口,并使用主成份分析方法進行載荷和得分的計算;如果窗口 數量達到上限,則合并最近的兩個窗口,否則直接建立一個新的窗口。 所述步驟S5中的增量主成份分析方法(IPCA),它不必假設輸入樣本為零均值并 可以動態地更新均值,其描述如下: 給定一個d*n的近紅外光譜數據矩陣Xn= {X ^ X2, ... Xn},其中,X1表示第i個批 次的數據(d表示d維數向量)。 針對第一批次的近紅外光譜的數據,利用PCA算法可以求得PCA得分矩陣F。: X0Q0= F 〇 其中P。表示第〇批次數據的載荷,即單位特征向量。L----J ·ν·.ι I V:V. I I I VUI I / 1V U I I V I 1 綜上所述,對于每一個新輸入樣本Xn,都可以根據之前的樣本對新輸入的樣本進 行修正,并預測它在整個集合中的特征值和特征向量。 與現有技術相比,本專利技術在牛奶凝結過程中的近紅外光譜數據基礎上,利用聚類 方法將數據聚類到多個窗口中,然后使用增量主成份分析方法對窗口內數據進行降維,而 且當后續的批次數據加入窗口內時,可以通過新增加的樣本數據來修正原來的數據,從而 可以對窗口內的特征值和特征向量進行持續的更新,最終動態窗口中的特征數據將精確反 映出牛奶凝結過程。本專利技術的方法結合了基于窗口的聚類方法和增量主成份分析方法,可 以對近紅外光譜數據進行更為可靠的數據分析,最終實現了對牛奶凝結過程的精準監測。 通過反復試驗驗證,本專利技術的方法在對牛奶凝結過程進行檢測時,準確率高達90%以上,可 以用于生產更高質量奶酪。【附圖說明】 圖1是本專利技術的流程示意圖; 圖2是本專利技術的實施例的近紅外光譜數據維數圖; 圖3是本專利技術的實施例的第一批次PCl得分百分比圖; 圖4是第二批次數據的修正并預測PCl得分和未經修正PCl關系圖; 圖5是本專利技術實施例的誤差率示意圖。【具體實施方式】 下面結合實施例對本專利技術作進一步的說明,但并不作為對本專利技術限制的依據。對 本專利技術所做的任何形式上的變通和/或改變都將落入本專利技術保護范圍。 本專利技術的實施例:,如圖1所 示,包括以下步驟: SI.采集多個批次的牛奶凝結過程中各個時間點的近紅外光譜數據作為原始數 據; S2.對原始數據進行標準化的預處理,得到多個批次的標準化數據; S3.通過聚類算法將第一個批次的標準化數據進行聚類操作,生成多個聚類,并將 這些聚類標識為不同的窗口; S4.對每個窗口中的標準化原始數據進行主成份分析,得到每個窗口內的數據載 荷,并計算出主成份得分; S5.根據時間點的對應關系,將對下一個批次的標準化原始數據增加到各個窗口 中,并使用增量主成份分析方法對窗口中的新增數據進行修正以及預測它們的載荷和主成 份得分,并形成當前窗口的數據特征; S6.對剩余批次的標準化數據逐個重復步驟S5 ; S7.采集待監測的牛奶凝結過程中的近紅外光譜實時數據,并以步驟S5相同的方 法將近紅外光譜實時數據歸類到相應窗口中,依據窗口內的近紅外光譜實時數據的主成分 得分來判斷當前牛奶凝結狀態,并進行相應處理。e 其具體實施時可采用如下步驟: 本實施例使用的是牛奶凝結過程的十二批次的近紅外光譜數據。 步驟1 :數據的提取,每個批次中包含的數據結構是一個X對應一個時間點t。其 中t為牛奶凝結過程的時間,X為相對應t時間點的1557維數的近紅外光譜數據。 batch1: (x n, tn), (x12, t12). . . (xln, tln) ...... batchn: (x nl, tnl), (xn2, tn2). . . (xnn, tj 步驟2 :對數據進行預處理,對行預處理得到X。,預處理使用標準化函數。 即 步驟3 :計算X。的多維歐式距離d 其中Χι1代表第一個點的第i維坐標,X 12代表第二個點的的第i維坐標。 轉成關于多維歐式距離的方陣A1 以下步驟4-7,通過聚類算法建立窗口,并計算數據的主成分得分。 步驟4 :設定初始值i = 1,j = 1,n = I (1彡η彡k) ·其中k為A1的總列數。若 an_j彡σ (σ為設定的一個閾值),σ >〇,則原(xln,t本文檔來自技高網...

【技術保護點】
基于增量主成份分析的牛奶凝結過程實時監測方法,其特征在于,包括以下步驟:S1.采集多個批次的牛奶凝結過程中各個時間點的近紅外光譜數據作為原始數據;S2.對原始數據進行標準化預處理,得到多個批次的標準化數據;S3.通過聚類算法將第一個批次的標準化數據進行聚類操作,生成多個聚類,并將這些聚類標識為不同的窗口;S4.對每個窗口中的標準化數據進行主成份分析,得到每個窗口內的數據載荷,并計算出主成份得分;S5.根據時間點的對應關系,將對下一個批次的標準化原始數據增加到各個窗口中,并使用增量主成份分析方法對窗口中的新增數據進行修正以及預測它們的載荷和主成份得分,形成當前窗口的數據特征;S6.對剩余批次的標準化數據逐個重復步驟S5;S7.采集待監測的牛奶凝結過程中的近紅外光譜實時數據,并以與步驟S5相同的方法將近紅外光譜實時數據歸類到相應窗口中,依據窗口內的近紅外光譜實時數據的主成分得分來判斷當前牛奶凝結狀態,并進行相應處理。
【技術特征摘要】
【專利技術屬性】
技術研發人員:趙煜輝,焦昀濤,周琳,單鵬,馬海濤,劉福來,
申請(專利權)人:東北大學,
類型:發明
國別省市:遼寧;21
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。