本發明專利技術公開了一種基于改進AdaBoost算法的4?CBA含量的軟測量方法,采用雙閾值的樣本權值更新方法,選用BP神經網絡訓練作為弱學習器,將得到的一組弱學習器采用AdaBoost算法進行組合得到強學習器。該方法選擇PTA氧化過程有關可測變量作為模型的輸入,4?CBA含量作為模型的輸出,選取歷史采集數據作為訓練樣本。本發明專利技術提出的改進的AdaBoost算法能夠減小誤差較大樣本對弱學習器的影響,提高了對4?CBA含量的預測精度。
【技術實現步驟摘要】
本專利技術涉及一種4-CBA含量的軟測量方法,特別涉及一種基于改進AdaBoost算法的4-CBA含量的軟測量方法,屬于化學工程領域。
技術介紹
AdaBoost(AdaptiveBoosting)算法是Freund和Schapire提出的將弱學習器提升為強學習器的算法,該算法不僅可以將任意弱學習器組合提升,還可以提高強學習器的預測精度,目前已廣泛應用于兩類問題,多分類問題和回歸問題等方面。AdaBoost算法的主要思想是給每個訓練樣本賦予樣本權值,在訓練弱學習器的過程中更新樣本權值,其中樣本權值變化是由當前訓練的弱學習器的訓練結果決定,訓練誤差大的樣本權值會加大,訓練誤差小的樣本權值會減小,訓練結束后樣本權值大的樣本會作為下一輪訓練樣本繼續訓練,這樣反復迭代,最后得到一組弱學習器,將它們組合得到強學習器。AdaBoost算法已在分類問題中取得了非常好的預測效果,但是由于回歸問題不同于分類問題的誤差函數,所以針對分類問題提出的AdaBoost算法不能直接應用于回歸問題。因此,1997年Freund和Schapire又提出了AdaBoost.R算法,該算法通過是回歸問題轉化為二分類分類問題,依據分類AdaBoost算法解決后再轉化為回歸問題。Drucker將AdaBoost.R算法進行改進提出AdaBoost.R2,在每一輪循環中使用依據弱學習器預測來更新樣本權值,并依據調整后的樣本權值重新選擇訓練樣本,繼而進行下一輪訓練,該方法首次應用到實際回歸問題中并取得了較好的效果。Solomatine和Shrestha等人提出具有代表性的AdaBoost.RT算法,算法是直接應用于回歸問題中,通過計算訓練樣本的相對預測誤差來更新樣本權值,并且引入相對誤差閾值φ,算法每一輪依據閾值來更新樣本權值,將相對預測誤差大于閾值的樣本權值相對增加,小于閾值的樣本權值相對減小,每次將樣本權值大的樣本作為下一次迭代中訓練樣本,該方法取得良好的預測效果。AdaBoost算法的預測精度與閾值φ和訓練樣本的選取有一定的關系,在AdaBoost算法的應用中,閾值φ初始值的選擇需要經過反復試錯法得到,增加算法時間復雜度,閾值φ的選取也影響著訓練樣本的抽取和訓練的弱學習器權重。PX氧化是在反應溫度為190攝氏度左右,壓力為1.258MPa,在鈷、錳、溴三元催化劑作用下以醋酸為溶劑,用空氣中的氧氣為氧化劑將PX氧化為TA(對苯二甲酸),TA進一步純化后得到PTA(精對苯二甲酸)的過程。該氧化反應反應機理非常復雜,是高溫高壓下氣液固三相反應,中間產物和副產物較多。PX氧化反應主要由四個反應組成,除原料PX和最終產品AT外,還有其它中間產物:AT(對甲基苯甲醛)、PT(對甲基苯甲酸)和4-CBA(對羥基苯甲醛)。其中4-CBA含量是PTA產品中的主要的副產物,也是PTA成品分析的重要質量指標,4-CBA含量過高,則PTA產品的著色,質量達不到要求,4-CBA含量過低,則氧化反應程度加深,副反應加劇,能耗及醋酸、PX單耗增加。為了減小原料降耗,并且保證PTA的產品質量,采用對4-CBA含量進行實時監控。4-CBA含量無法用常規的方法在線測量,而是通過實驗室分析化驗出來,而離線分析時間比較長,往往滯后數小時;同時實驗分析化驗成本較高,其采樣間隔較長,采樣次數少,無法滿足對4-CBA含量進行實時監控的要求,比如某工廠對4-CBA含量的采樣周期為8小時,每天固定在0點,8點和16點采樣,因此一天最多只有三個滯后數小時的4-CBA含量的分析值。需要采用軟測量技術在線估計4-CBA含量。
技術實現思路
本專利技術所要解決的技術問題是提供一種基于改進AdaBoost算法的4-CBA含量的軟測量方法,提出雙閾值對樣本權值更新,獲得高效的4-CBA含量軟測量模型。本專利技術為解決上述技術問題采用以下技術方案:本專利技術提供一種基于改進AdaBoost算法的4-CBA含量的軟測量方法,包括以下具體步驟:步驟1,選擇若干個過程變量作為軟測量模型的輸入變量,軟測量模型的輸出量為4-CBA的含量;步驟2,采集m組輸入變量所對應的歷史運行數據和相應的4-CBA含量的分析數據作為初始訓練樣本;并對初始訓練樣本中的每組樣本數據定義一個樣本權值,且設置樣本權值的初值均為1/m;步驟3,基于AdaBoost算法采用初始訓練樣本訓練k個BP神經網絡,將該k個BP神經網絡組合后得到軟測量模型,具體為:3.1,令迭代次數t=1;3.2,采用初始訓練樣本對一個BP神經網絡進行訓練,并根據公式1-3分別計算本次迭代訓練完成的BP神經網絡的相對預測誤差、平均相對誤差和最大閾值:其中,et(i)為第t次迭代訓練完成的BP神經網絡的相對預測誤差,ft(xi)為第t次迭代訓練完成的BP神經網絡對應第i組樣本數據的預測輸出,yi為第i組樣本數據中的4-CBA含量的分析數據;為第t次迭代訓練完成的BP神經網絡的平均相對誤差;Φt為第t次迭代訓練完成的BP神經網絡的最大閾值,n為系數;3.3,根據公式4更新初始訓練樣本中的每組樣本數據的樣本權值,具體為:其中,Dt+1(i)為第t+1次迭代時初始訓練樣本中的第i組樣本數據的樣本權值,Dt(i)為第t次迭代時初始訓練樣本中的第i組樣本數據的樣本權值,且D1(i)=1/m;Bt是歸一化因子;n'為系數,3.4,若t<k,則采用輪盤賭算法從更新樣本權值后的初始訓練樣本中抽取m'組數據作為下一次迭代的訓練樣本,且令t=t+1返回步驟4;否則執行步驟3.5;3.5,根據公式5將訓練完成的k個BP神經網絡進行組合,得到軟測量模型為:其中,ft(x)表示第t次迭代訓練完成的BP神經網絡;步驟4,根據步驟3得到的軟測量模型,即可實現對4-CBA含量的軟測量。作為本專利技術的進一步優化方案,步驟3.4中m'<m。作為本專利技術的進一步優化方案,步驟3.4中m'的取值范圍為(80,m)。作為本專利技術的進一步優化方案,步驟3.2中系數n的取值為2或3。作為本專利技術的進一步優化方案,步驟1中選擇氧化反應器物料進料流量、催化劑濃度、氧化反應器液位、氧化反應器溫度、氧化反應器尾氧含量、第三冷凝器排出水量、第四冷凝器排出水量、催化劑濃度、第一結晶器溫度、第一結晶器尾氧含量、反應生成的CO2含量、反應生成的CO含量共12個過程變量作為軟測量模型的輸入變量。作為本專利技術的進一步優化方案,步驟3.3中系數n'的取值為1,2或3。本專利技術采用以上技術方案與現有技術相比,具有以下技術效果:本專利技術設置最大閾值和輪盤賭算法對訓練樣本概率抽樣改進AdaBoost算法,實質是減弱預測誤差較大樣本權值對弱學習器的權重的影響,將預測誤差比較大的樣本以概率抽樣作為下一次迭代的訓練樣本。通過設置最大閾值將預測誤差較大樣本權值減小,弱學習器的權重主要有預測誤差比較大的樣本影響,輪盤賭算法抽取樣本是樣本權值越大,被抽到的概率越大,預測誤差比較大的樣本作為下一輪訓練樣本的概率越大。這樣改進的AdaBoost算法減小預測誤差較大樣本對訓練的影響,增強模型的預測精度,因為AdaBoost算法閾值初始值是由反復試錯法的得到的,改進的AdaBoost算法還減少算法時間復雜度。具體實施方式下面對本專利技術的技術方案做進一步的詳細說明:本專利技術提供本文檔來自技高網...
【技術保護點】
一種基于改進AdaBoost算法的4?CBA含量的軟測量方法,其特征在于,包括以下具體步驟:步驟1,選擇若干個過程變量作為軟測量模型的輸入變量,軟測量模型的輸出量為4?CBA的含量;步驟2,采集m組輸入變量所對應的歷史運行數據和相應的4?CBA含量的分析數據作為初始訓練樣本;并對初始訓練樣本中的每組樣本數據定義一個樣本權值,且設置樣本權值的初值均為1/m;步驟3,基于AdaBoost算法采用初始訓練樣本訓練k個BP神經網絡,將該k個BP神經網絡組合后得到軟測量模型,具體為:3.1,令迭代次數t=1;3.2,采用初始訓練樣本對一個BP神經網絡進行訓練,并根據公式1?3分別計算本次迭代訓練完成的BP神經網絡的相對預測誤差、平均相對誤差和最大閾值:et(i)=|ft(xi)-yiyi|---(1)]]>其中,et(i)為第t次迭代訓練完成的BP神經網絡的相對預測誤差,ft(xi)為第t次迭代訓練完成的BP神經網絡對應第i組樣本數據的預測輸出,yi為第i組樣本數據中的4?CBA含量的分析數據;為第t次迭代訓練完成的BP神經網絡的平均相對誤差;Φt為第t次迭代訓練完成的BP神經網絡的最大閾值,n為系數;?3.3,根據公式4更新初始訓練樣本中的每組樣本數據的樣本權值,具體為:其中,Dt+1(i)為第t+1次迭代時初始訓練樣本中的第i組樣本數據的樣本權值,Dt(i)為第t次迭代時初始訓練樣本中的第i組樣本數據的樣本權值,且D1(i)=1/m;Bt是歸一化因子;n'為系數,?3.4,若t<k,則采用輪盤賭算法從更新樣本權值后的初始訓練樣本中抽取m'組數據作為下一次迭代的訓練樣本,且令t=t+1返回步驟4;否則執行步驟3.5;?3.5,根據公式5將訓練完成的k個BP神經網絡進行組合,得到軟測量模型為:h(x)=Σtβt*ft(x)/Σtβt;---(5)]]>?其中,ft(x)表示第t次迭代訓練完成的BP神經網絡;?步驟4,根據步驟3得到的軟測量模型,即可實現對4?CBA含量的軟測量。...
【技術特征摘要】
1.一種基于改進AdaBoost算法的4-CBA含量的軟測量方法,其特征在于,包括以下具體步驟:步驟1,選擇若干個過程變量作為軟測量模型的輸入變量,軟測量模型的輸出量為4-CBA的含量;步驟2,采集m組輸入變量所對應的歷史運行數據和相應的4-CBA含量的分析數據作為初始訓練樣本;并對初始訓練樣本中的每組樣本數據定義一個樣本權值,且設置樣本權值的初值均為1/m;步驟3,基于AdaBoost算法采用初始訓練樣本訓練k個BP神經網絡,將該k個BP神經網絡組合后得到軟測量模型,具體為:3.1,令迭代次數t=1;3.2,采用初始訓練樣本對一個BP神經網絡進行訓練,并根據公式1-3分別計算本次迭代訓練完成的BP神經網絡的相對預測誤差、平均相對誤差和最大閾值:et(i)=|ft(xi)-yiyi|---(1)]]>其中,et(i)為第t次迭代訓練完成的BP神經網絡的相對預測誤差,ft(xi)為第t次迭代訓練完成的BP神經網絡對應第i組樣本數據的預測輸出,yi為第i組樣本數據中的4-CBA含量的分析數據;為第t次迭代訓練完成的BP神經網絡的平均相對誤差;Φt為第t次迭代訓練完成的BP神經網絡的最大閾值,n為系數;3.3,根據公式4更新初始訓練樣本中的每組樣本數據的樣本權值,具體為:其中,Dt+1(i)為第t+1次迭代時初始訓練樣本中的第i組樣本數據的樣本權值,Dt(i)為第t次迭代時初始訓練樣本中的第i組樣本數據的樣本權值,且D1(i)=1/m;Bt是歸一化因子;n'為系數,3.4,若t<k,則采用輪盤賭算法...
【專利技術屬性】
技術研發人員:劉瑞蘭,劉樹云,
申請(專利權)人:南京郵電大學,
類型:發明
國別省市:江蘇;32
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。