本發(fā)明專利技術(shù)涉及一種基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法,首先基于歷史數(shù)據(jù)提取空氣質(zhì)量監(jiān)測(cè)站點(diǎn)的多領(lǐng)域特征,如預(yù)報(bào)氣象特征、實(shí)時(shí)氣象特征、交通特征、本地和周邊城市空氣污染物特征等。然后基于提取的特征訓(xùn)練多核回歸模型,并利用新的數(shù)據(jù)對(duì)多核回歸模型進(jìn)行在線調(diào)整。最后基于調(diào)整后的模型對(duì)未來一段時(shí)間內(nèi)監(jiān)測(cè)站點(diǎn)的空氣質(zhì)量進(jìn)行逐小時(shí)的預(yù)測(cè)。該方法可用來對(duì)城市監(jiān)測(cè)站點(diǎn)空氣質(zhì)量進(jìn)行準(zhǔn)確和高效的預(yù)測(cè),對(duì)于環(huán)境保護(hù)和公眾生活具有指導(dǎo)作用。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及空氣質(zhì)量監(jiān)測(cè)領(lǐng)域,尤其涉及一種基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn) 空氣質(zhì)量預(yù)測(cè)方法。
技術(shù)介紹
空氣是地球上生物賴以生存的物質(zhì)。空氣質(zhì)量與人們的日常生活息息相關(guān),在城 市環(huán)境綜合評(píng)價(jià)中占有重要地位。但是隨著人類文明和經(jīng)濟(jì)的發(fā)展,空氣污染越來越嚴(yán)重, 如何改善空氣質(zhì)量、準(zhǔn)確預(yù)測(cè)空氣質(zhì)量變得越來越重要。根據(jù)空氣質(zhì)量預(yù)測(cè)結(jié)果,人們可以 采取相應(yīng)措施(如帶口罩、避免外出等)以避免受到空氣污染物的侵害。另一方面,環(huán)境 保護(hù)是全社會(huì)的事業(yè),公眾對(duì)環(huán)保的參與程度是一個(gè)國(guó)家環(huán)保工作開展是否成功的重要標(biāo) 志。如果城市空氣質(zhì)量能像天氣一樣每天公布預(yù)報(bào)結(jié)果,公眾就可以了解自己生活空間的 環(huán)境質(zhì)量真實(shí)情況,有利于人民群眾參與和監(jiān)督環(huán)境保護(hù)工作。 傳統(tǒng)空氣質(zhì)量預(yù)測(cè)方法的問題主要在于特征和模型兩方面: 從特征層面來講,因?yàn)榭諝馕廴疚飼?huì)隨著大氣不斷流動(dòng),所以周邊城市的空氣污 染物水平是緊密相關(guān)的,比如若一個(gè)城市的空氣質(zhì)量為嚴(yán)重污染且刮北風(fēng),那么一段時(shí)間 之后位于該城市南方城市的空氣質(zhì)量也會(huì)受到影響。而傳統(tǒng)的空氣質(zhì)量預(yù)測(cè)方法僅考慮了 氣象、交通、本地空氣污染物等相關(guān)領(lǐng)域的特征,沒有考慮周邊城市的空氣質(zhì)量狀況對(duì)待預(yù) 測(cè)城市的影響,從而影響了預(yù)測(cè)結(jié)果的準(zhǔn)確性。另一方面,傳統(tǒng)的空氣質(zhì)量預(yù)測(cè)方法在模型 訓(xùn)練階段使用基于實(shí)時(shí)氣象數(shù)據(jù)的相關(guān)特征,預(yù)測(cè)階段則使用基于預(yù)報(bào)氣象數(shù)據(jù)的相關(guān)特 征,而實(shí)時(shí)和預(yù)報(bào)氣象數(shù)據(jù)都是與空氣質(zhì)量相關(guān)的,應(yīng)該給予同時(shí)考慮,否則會(huì)影響模型的 有效性。 從模型層面來講,由于產(chǎn)生式模型(如馬爾科夫模型等)具有標(biāo)記偏置和獨(dú)立性 假設(shè)等固有缺陷,導(dǎo)致其預(yù)測(cè)準(zhǔn)確率不太理想;而判別式模型(如決策樹、支持向量機(jī)等) 雖然比產(chǎn)生式模型要簡(jiǎn)單,但是由于其黑盒操作,不能清楚展現(xiàn)數(shù)據(jù)間的關(guān)系,從而不能反 映訓(xùn)練數(shù)據(jù)本身的特性,進(jìn)而對(duì)其預(yù)測(cè)能力產(chǎn)生了負(fù)面影響。條件隨機(jī)場(chǎng)模型雖然既具有 判別式模型比較容易學(xué)習(xí)的優(yōu)點(diǎn),又可以像產(chǎn)生式模型一樣考慮上下文標(biāo)記間的轉(zhuǎn)移概 率,但是其跟傳統(tǒng)的產(chǎn)生式模型和判別式模型一樣,都是批量式的學(xué)習(xí)方式,當(dāng)有新的數(shù)據(jù) 時(shí),需要基于全部數(shù)據(jù)進(jìn)行重新訓(xùn)練。由于重新訓(xùn)練代價(jià)高,使得模型難以及時(shí)更新。在線 單核回歸雖然能克服批量式處理模型的上述缺點(diǎn),但是其往往在學(xué)習(xí)任務(wù)之前,就固定了 一個(gè)核函數(shù),如果數(shù)據(jù)流隨著時(shí)間不穩(wěn)定變化,就會(huì)導(dǎo)致不理想的預(yù)測(cè)效果。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)為克服上述的不足之處,目的在于提供一種基于在線多核回歸的城市監(jiān)測(cè) 站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法,首先基于歷史數(shù)據(jù)提取空氣質(zhì)量監(jiān)測(cè)站點(diǎn)的多領(lǐng)域特征,如氣象 特征、交通特征、本地和周邊城市空氣污染物特征等,然后基于提取的特征訓(xùn)練多核回歸模 型,并利用新的數(shù)據(jù)對(duì)多核回歸模型進(jìn)行在線調(diào)整;最后基于調(diào)整后的模型對(duì)監(jiān)測(cè)站點(diǎn)未 來一段時(shí)間內(nèi)的空氣質(zhì)量進(jìn)行逐小時(shí)的預(yù)測(cè)。本方法能夠更準(zhǔn)確地預(yù)測(cè)空氣質(zhì)量。 本專利技術(shù)是通過以下技術(shù)方案達(dá)到上述目的:一種基于在線多核回歸的城市監(jiān)測(cè)站 點(diǎn)空氣質(zhì)量預(yù)測(cè)方法,包括如下步驟: (1)對(duì)歷史原始數(shù)據(jù)進(jìn)行預(yù)處理得到歷史數(shù)據(jù)樣本,基于歷史數(shù)據(jù)樣本得到訓(xùn)練 數(shù)據(jù)集(\,Yk)和核池KP; (2)結(jié)合訓(xùn)練數(shù)據(jù)集(Xk,Yk)和核池KP對(duì)子模塊Mk進(jìn)行訓(xùn)練,輸出預(yù)測(cè)模型Μ= {MkI1 ^k^h}; (3)利用實(shí)時(shí)新監(jiān)測(cè)數(shù)據(jù)對(duì)各子模型Mk(l彡k彡h)調(diào)整為A,并將預(yù)測(cè)模型Μ 更新為調(diào)整后的預(yù)測(cè)模型I (4)基于預(yù)測(cè)模型I對(duì)未來每個(gè)待預(yù)測(cè)時(shí)刻ρ的空氣質(zhì)量進(jìn)行預(yù)測(cè)。 作為優(yōu)選,所述步驟(1)的歷史原始數(shù)據(jù)包含預(yù)報(bào)氣象相關(guān)特征只、實(shí)時(shí)氣象相 關(guān)特征、空氣污染物相關(guān)特征、交通相關(guān)特征只-,、周邊監(jiān)測(cè)站點(diǎn)特征if和周邊城 市特征。 作為優(yōu)選,所述步驟(1)得到訓(xùn)練數(shù)據(jù)集(Xk,Yk)和核池KP的方法流程如下: 1)對(duì)歷史原始數(shù)據(jù)進(jìn)行數(shù)據(jù)對(duì)齊,并用平均值替換缺失值和極端值完成數(shù)據(jù)清 理,得到歷史數(shù)據(jù)樣本X=kj11 <j<η},其中,η表示樣本個(gè)數(shù),是第j個(gè)小時(shí)內(nèi)的歷 史原始數(shù)據(jù)以及以往的空氣質(zhì)量組成的向量; 2)基于歷史數(shù)據(jù)樣本,為子模型#構(gòu)造訓(xùn)練數(shù)據(jù)集: 2. 1)提取特征組成訓(xùn)練特征向量集爲(wèi)=俱11在/彡其中 np;:,p:,n,w 2. 2)所有樣本的空氣質(zhì)量構(gòu)成標(biāo)記序列Yk={Υ·] | 1彡j彡η},Υ·^示樣本X。的 標(biāo)記;并得到\與Yk組成Μ啲訓(xùn)練數(shù)據(jù)集(Xk,Yk); 3)重復(fù)h次步驟2),得到訓(xùn)練數(shù)據(jù)集D= {(Xk,Yk)I1彡k彡h},其中h表示預(yù)測(cè) 最大的時(shí)間范圍; 4)選取m個(gè)不同的核函數(shù)構(gòu)成核池KP= {kfs| 1 <s<m},kfs表示核池中第s 個(gè)核函數(shù)。 作為優(yōu)選,所述步驟(2)的子模塊#由!11個(gè)單核回歸器和權(quán)重向量集Weights'll 成,其中每個(gè)單核回歸器由支持向量集評(píng)f、參數(shù)集構(gòu)成。 作為優(yōu)選,所述步驟(2)輸出預(yù)測(cè)模型Μ的步驟流程如下: (i)通過樸素回歸誤差最小化算法訓(xùn)練第s個(gè)單核回歸器,得到支持向量集#和 參數(shù)集翻^ (ii)重復(fù)m次步驟⑴,得到m個(gè)單核回歸器的支持向量集把和參數(shù)集J 得到子模型Mk 的支持向量集 =?6Τ/' | 1S〃;},參數(shù)集 =i/i/pAa:' |?Ss·S?}:; (iii)通過隨機(jī)梯度下降算法得到權(quán)重向量集Weights14; (iv)重復(fù)h次步驟(i)至步驟(iii),完成對(duì)h個(gè)子模型的訓(xùn)練;得到并輸出預(yù)測(cè) 模型Μ= {Mk 11彡k彡h}。 作為優(yōu)選,所述步驟(3)得到翁^與調(diào)整后的預(yù)測(cè)模型I所用的方法與步驟(2)所 用的方法相同。 作為優(yōu)選,所述步驟(4)對(duì)未來每個(gè)待預(yù)測(cè)時(shí)刻p的空氣質(zhì)量進(jìn)行預(yù)測(cè),設(shè)待預(yù)測(cè) 時(shí)刻P與當(dāng)前時(shí)刻的間隔小時(shí)數(shù)為k,Kk<h,方法如下: (I)基于時(shí)刻p的預(yù)報(bào)氣象數(shù)據(jù)和歷史數(shù)據(jù),提取特征組成待預(yù)測(cè)向量X\, Χ^ψ《,巧具,靡 (II)將乂\作為預(yù)測(cè)模型分的輸入,得到待預(yù)測(cè)時(shí)刻k的預(yù)測(cè)值Υ\; (III)重復(fù)h次步驟(I)至步驟(II),完成對(duì)未來h個(gè)小時(shí)的空氣質(zhì)量的預(yù)測(cè); (IV)輸出預(yù)測(cè)序列Y*= {Y\| 1彡k彡h}。 本專利技術(shù)的有益效果在于:(1)引入氣象學(xué)、交通和本地空氣污染物等領(lǐng)域相關(guān)特 征,而且還引入周邊城市空氣污染物特征,考慮周邊城市空氣質(zhì)量對(duì)待預(yù)測(cè)城市空氣質(zhì)量 的影響,從而可以更準(zhǔn)確地預(yù)測(cè)空氣質(zhì)量;(2)考慮實(shí)時(shí)氣象數(shù)據(jù),還同時(shí)考慮預(yù)報(bào)氣象數(shù) 據(jù)對(duì)空氣質(zhì)量的影響,使得預(yù)測(cè)模型更高效;(3)采用在線多核回歸模型,不僅克服了傳統(tǒng) 批量式處理模型及時(shí)更新代價(jià)較大的缺陷,而且解決了在線單核回歸由于核函數(shù)固定引起 的性能問題。【附圖說明】 圖1是本專利技術(shù)基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法流程圖; 圖2是本專利技術(shù)實(shí)施例模型建立部分流程圖; 圖3是本專利技術(shù)實(shí)施例核函數(shù)詳細(xì)信息示意圖; 圖4是本專利技術(shù)實(shí)施例在線模型調(diào)整及預(yù)測(cè)流程圖。【具體實(shí)施方式】 下面結(jié)合具體實(shí)施例對(duì)本專利技術(shù)進(jìn)行進(jìn)一步描述,但本專利技術(shù)的保護(hù)范圍并不僅限于 此: 實(shí)施例:如圖1所示,, 首先通過模型建立部分得到多核回歸模型,其次當(dāng)有新的數(shù)據(jù)時(shí),對(duì)模型進(jìn)行在線調(diào)整,得 到新的模型Μ;然后基于Μ進(jìn)行在線預(yù)測(cè)。 該方法分為兩大部分:模型建立部分和在線部分。其中,模型建立部分包括數(shù)據(jù)預(yù) 處理和模型訓(xùn)練兩個(gè)階段;在線部分包括數(shù)據(jù)預(yù)處理、本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種基于在線多核回歸的城市監(jiān)測(cè)站點(diǎn)空氣質(zhì)量預(yù)測(cè)方法,其特征在于,包括如下步驟:(1)對(duì)歷史原始數(shù)據(jù)進(jìn)行預(yù)處理得到歷史數(shù)據(jù)樣本,基于歷史數(shù)據(jù)樣本得到訓(xùn)練數(shù)據(jù)集(Xk,Yk)和核池KP;(2)結(jié)合訓(xùn)練數(shù)據(jù)集(Xk,Yk)和核池KP對(duì)子模塊Mk進(jìn)行訓(xùn)練,輸出預(yù)測(cè)模型M={Mk|1≤k≤h};(3)利用實(shí)時(shí)新監(jiān)測(cè)數(shù)據(jù)對(duì)各子模型Mk(1≤k≤h)調(diào)整為并將預(yù)測(cè)模型M更新為調(diào)整后的預(yù)測(cè)模型(4)基于預(yù)測(cè)模型對(duì)未來每個(gè)待預(yù)測(cè)時(shí)刻p的空氣質(zhì)量進(jìn)行預(yù)測(cè)。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王敬昌,陳嶺,趙江奇,沈迪,袁翠麗,
申請(qǐng)(專利權(quán))人:杭州尚青科技有限公司,
類型:發(fā)明
國(guó)別省市:浙江;33
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。