本發明專利技術的基于半監督學習的道路交通狀態判別方法,包括:a)采集道路及上、下游路口的交通流數據;b)對交通狀態進行標記;c)生成標記訓練集;d)生成標記訓練集、;e)利用、、對3種基分類器進行訓練;f)選取個未標記樣本;g)協同訓練基分類器;h)重復執行步驟g),直至協同訓練完畢。本發明專利技術的道路交通狀態判別方法,首先利用已標記的交通流數據對分類器進行訓練,然后利用未標記的交通流數據進行協同訓練,充分利用了節省成本的未標記數據,有利于形成更加準確的基分類器,提高交通狀態判別的正確率,提升交通管理、決策、規劃和運營的正確性和智能交通信息服務的質量。
【技術實現步驟摘要】
【專利摘要】本專利技術的基于半監督學習的道路交通狀態判別方法,包括:a)采集道路及上、下游路口的交通流數據;b)對交通狀態進行標記;c)生成標記訓練集;d)生成標記訓練集、;e)利用、、對3種基分類器進行訓練;f)選取個未標記樣本;g)協同訓練基分類器;h)重復執行步驟g),直至協同訓練完畢。本專利技術的道路交通狀態判別方法,首先利用已標記的交通流數據對分類器進行訓練,然后利用未標記的交通流數據進行協同訓練,充分利用了節省成本的未標記數據,有利于形成更加準確的基分類器,提高交通狀態判別的正確率,提升交通管理、決策、規劃和運營的正確性和智能交通信息服務的質量。【專利說明】
本專利技術涉及,更具體的說,尤其涉及一種首先利用有標記的交通流數據對基分類器進行訓練然后再利用無標記的交通流數據進行協同訓練的基于半監督學習的道路交通狀態判別方法。
技術介紹
隨著城市的迅速發展,交通擁堵、交通污染日益嚴重,交通尾氣排放是目前霧霾的主要污染源之一。這些都是各大城市亟待解決的問題,智能交通成為改善城市交通的關鍵所在。近年來,各大、中城市的智能交通系統不斷完善,智能化程度不斷提高,交通數據采集的范圍、廣度和深度急劇增加,正在形成以線圈、微波、GPS、車牌等交通流檢測數據,交通監控視頻數據,以及系統數據和服務數據等為主體的海量交通數據,這為道路交通狀態判別提供了更加豐富的信息。道路交通狀態需要通過對采集交通流數據分析得到判別結果,道路交通狀態無法通過采集設備直接獲取。因此,采集的大量交通流數據都是無標記樣本,道路交通狀態的樣本需要通過人為判別進行標注,耗費大量的人力物力,要獲取大量有標記的道路交通狀態樣本非常困難。交通狀態判 別是智能交通系統的重要研究內容,已有大量的研究成果,很多數據挖掘方法被用于交通狀態的自動判別,如支持向量機、BP神經網絡、決策樹、K-最近鄰分類方法、貝葉斯神經網絡等。雖然如此,仍有很多交通狀態判別方法很難在實際中應用,主要原因是這些有監督的交通狀態判別方法需要大量的訓練樣本,而實際中很難采集大量的交通狀態樣本,因此限制了很多數據挖掘方法在實際交通狀態判別中的應用。如果只使用少量的有標記樣本,那么利用它們所訓練出的學習系統往往很難具有強泛化能力;另一方面,如果僅使用少量“昂貴的”有標記樣本而不利用大量“廉價的”未標記樣本,則是對數據資源的極大的浪費。如果大規模交通流數據被充分利用,必將提高交通狀態判別的正確率,但常規的交通狀態判別方法的計算量隨著樣本量的增長呈指數級增長。半監督學習是模式識別和機器學習領域研究的重點問題,是監督學習與無監督學習相結合的一種學習方法,利用少量有標簽數據訓練初始分類器,同時用大量無標簽數據來進一步改進初始分類器的性能以最終達到精確學習的一種綜合學習方法,它可有效解決少量標注樣本和大量未標注樣本的分類問題。
技術實現思路
本專利技術為了克服上述技術問題,提供了。本專利技術的基于半監督學習的道路交通狀態判別方法,其特別之處在于,包括以下步驟:a).采集交通流數據,采集道路及其上游路口、下游路口的交通流數據,所采集的交通流數據包括交通流量β、時間占有率O和車輛速度V ;設:時刻待預測道路上的交通流數據分別上游路口、下游路口的交通流數據分別為W、O-、V丨和ql、Os1、vf,其中:i = l,2,..、!:,i為所采集的交通流數據的數目;b).人工標記樣本,通過人工觀察視頻監測數據或現場觀察的方式,對步驟a)中采集的部分道路交通流數據對rz的文通狀態進行標注,生成 > 個交通狀態F=(乃|i = 1,2,...,均,由此生成訓練測試樣本集P,樣本集F表示為:【權利要求】1.,其特征在于,包括以下步驟: a).采集交通流數據,采集道路及其上游路口、下游路口的交通流數據,所采集的交通流數據包括交通流量β、時間占有率O和車輛速度設時刻待預測道路上的交通流數據分別為&、%、%,上游路口、下游路口的交通流數據分別為和<、of、V;,其中j = 12,為所采集的交通流數據的數目; b).人工標記樣本,通過人工觀察視頻監測數據或現場觀察的方式,對步驟a)中采集的部分道路交通流數據對應的交通狀態進行標注,生成N個交通狀態y = {χ |? = l,2,--%iV),由此生成訓練測試樣本集f,樣本集i?表示為:2.一種根據權利要求1所述的基于半監督學習的道路交通狀態判別方法,其特征在于,還包括以下的交通狀態判別過程: I).采集待預測交通流數據,采集待預測道路及其上、下游路口的交通流數據,交通流數據包括交通流量、時間占有率和車輛速度,獲得待預測道路的交通流數據樣本; 2).獲取交通狀態,將步驟1)中獲取的待預測道路的交通流數據作為步驟h)中獲取的3個基分類器的輸入,分別獲取3個交通狀態; 3).確定交通狀態,對于步驟2)中獲取的交通狀態,利用少數服從多數的投票法確定當前道路的交通狀態。3.根據權利要求1或2所述的基于半監督學習的道路交通狀態判別方法,其特征在于,步驟g)中所述的協同訓練基分類器通過以下步驟來實現: g-1).將未經人工標記的交通流數據樣本作為三個基分類器的輸入,并求出輸出的交通管理狀態,設第一、第二、第三個基分類器的輸出狀態分別為YT、Y*、Ym ; g-2).判斷YT與Ym是否相同,如果yt = ym,則執行步驟g_3);如果yt≠ym,則執行步驟 g_4); g-3).yt= yn時,判斷與輸出狀態Z是否相同,如果yt= yn =ym ,則對該樣本標記后,基分類器不變;如果.Vyt=yn≠ym則將該樣本標記后加入第三個基分類器的有標記訓練集,形成新的訓練集對第三個基分類器重新進行訓練; g-4).yt≠yn時,判斷輸出狀態yt與ym是否相同,如果yt=ym,,則將該樣本標記后加入第二個基分類器的有標記訓練集,形成新的訓練集對第二個基分類器重新進行訓練;如果,則執行步驟g-5);g-5).yt≠ym且時yt≠ym,判斷輸出狀態ym與yn是否相同,如果,則將該樣本標記后加入第一個基分類器的有標記訓練集,形成新的訓練集對第一個基分類器重新進行訓練;如果yn≠ym,則對該訓練集不做標記,基分類器均不變。4.根據權利要求1或2所述的基于半監督學習的道路交通狀態判別方法,其特征在于:步驟e)中所述的3種基分類器分別為貝葉斯網絡、決策樹和支持向量機。【文檔編號】G08G1/01GK103903441SQ201410135031【公開日】2014年7月2日 申請日期:2014年4月4日 優先權日:2014年4月4日 【專利技術者】孫占全, 趙彥玲, 顧衛東, 張新常 申請人:山東省計算中心本文檔來自技高網...
【技術保護點】
1.一種基于半監督學習的道路交通狀態判別方法,其特征在于,包括以下步驟:a).采集交通流數據,采集道路及其上游路口、下游路口的交通流數據,所采集的交通流數據包括交通流量、時間占有率和車輛速度;設時刻待預測道路上的交通流數據分別為、、,上游路口、下游路口的交通流數據分別為、、和、、,其中:,為所采集的交通流數據的數目;b).人工標記樣本,通過人工觀察視頻監測數據或現場觀察的方式,對步驟a)中采集的部分道路交通流數據對應的交通狀態進行標注,生成個交通狀態,由此生成訓練測試樣本集,樣本集表示為:其中,時刻交通流樣本參數為:交通狀態取值為暢通、擁擠或堵塞,;為判斷時刻道路交通狀態所需的歷史采樣時間點個數;c).生成標記訓練集,從樣本集中隨機有放回地抽取個樣本,形成一個有標記訓練集,≤;d).重復生成標記訓練集,采用與步驟c)中相同的方法,再形成兩個有標記的訓練集、,訓練集和的樣本數也均為;e).訓練基分類器,選擇3種基分類器,利用訓練集、、分別對3種基分類器進行訓練;訓練方法為:將當前道路的交通流樣本輸入參數、上游及下游路口的交通流樣本輸入和綜合起來作為各基分類器的輸入,用表示,交通狀態作為各分類器的輸出,對基分類器進行訓練,形成訓練后的基分類器;f).選取未標記樣本,從未經人工標記交通狀態的交通流數據中選取個樣本,以便對3個基分類器進行協同訓練;g).協同訓練基分類器,如果任意兩個訓練后的基分類器對同一個未標記樣本的交通流輸入參數所預測的交通狀態結果相同,則表明該樣本具有較高的標識置信度,對該樣本標記后加入第三個基分類器的有標記訓練集,形成新的訓練集,并對第三個分類器重新進行訓練;如果3個分類器對同一樣本的預測一致,則將該樣本標記后,各基分類器均不變;如果3個分類器對同一樣本的預測結果均不相同,則對該樣本不做標記,各基分類器均不變;h).重復執行步驟g),直至個未經人工標記樣本全部參與協同訓練,以使3個基分類器不再有變化,協同訓練過程結束。...
【技術特征摘要】
【專利技術屬性】
技術研發人員:孫占全,趙彥玲,顧衛東,張新常,
申請(專利權)人:山東省計算中心,
類型:發明
國別省市:山東;37
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。