【技術實現步驟摘要】
基于車輛GPS軌跡數據聚類的軌跡補全方法
[0001]本專利技術屬于軌跡數據處理
,具體涉及一種基于車輛GPS軌跡數據聚類的軌跡補全方法。
技術介紹
[0002]當今社會,隨著全球定位技術、移動互聯網技術的飛速發展和普及,以及交通運輸的發展,產生了海量的車輛軌跡數據。車輛軌跡數據在交通路線優化、個性化路線推薦、路網預測、城市區域規劃等方面發揮著不可替代的作用。但是因為定位設備以及復雜地形良莠不齊的影響,車輛軌跡數據的缺失和數據質量差是一個不可避免的問題,噪聲點過多或者有大量缺失軌跡點的軌跡會影響對車輛軌跡數據的利用。為此,需要對收集到的軌跡數據進行軌跡補全。
[0003]傳統的基于幾何模型和基于統計概率模型的數據補全,對軌跡數據質量依賴較大,且只能利用當前軌跡的缺失點的上下文信息,不能充分利用道路其他車輛軌跡數據信息進行補全。此外,基于聚類模型的數據補全,通過尋找與當前軌跡相似分類的歷史軌跡數據,對稀疏軌跡進行補全,可以合理利用相似分類軌跡蘊含的信息,指導軌跡補全工作。目前的基于軌跡聚類的軌跡補全方法較少,且并沒有找到合適的度量方法對長度不同的軌跡進行相似度計算,從而無法獲得較好的軌跡聚類結果,導致軌跡補全效果不佳。
技術實現思路
[0004]本專利技術旨在至少解決現有技術中存在的技術問題之一,提供一種基于車輛GPS軌跡數據聚類的軌跡補全方法。
[0005]本專利技術提供一種基于車輛GPS軌跡數據聚類的軌跡補全方法,所述軌跡補全方法包括:
[0006]步驟S1:獲取車輛的 ...
【技術保護點】
【技術特征摘要】
1.一種基于車輛GPS軌跡數據聚類的軌跡補全方法,其特征在于,所述軌跡補全方法包括:步驟S1:獲取車輛的GPS歷史軌跡數據;其中,所述軌跡數據包括車輛編號、記錄時刻以及經緯度信息;步驟S2:根據所述車輛編號,對所述軌跡數據進行分割,將相同車輛編號的數據組成單個車輛對象的軌跡數據,并根據每輛車的軌跡點的記錄時刻進行排序,得到軌跡數據格式Traj;步驟S3:構建軌跡數據集合Trajs,初始化為空,用于映射軌跡唯一編號和對應軌跡,依次對每條軌跡數據進行子軌跡劃分,并將劃分后的軌跡加入所述軌跡數據集合中;其中,軌跡劃分采用基于停靠點的車輛軌跡劃分方法;步驟S4:設定初始聚類中心個數K;步驟S5:從所述軌跡數據集合中選取K個初始聚類中心;步驟S6:計算除聚類中心外的所有軌跡數據與每個聚類中心的最長公共關鍵特征點距離LCKFD;步驟S7:構建元素類型為集合、長度為K的數組Clusters,Clusters(i)中存放屬于第i個聚類的軌跡數據,Clusters(i)初始有一個元素C
i
,C
i
為該聚類的初始聚類中心;步驟S8:遍歷每一條軌跡數據,將其劃分到與其具有最小的LCKFD值的聚類中心所在的聚類;步驟S9:更新每個聚類的聚類中心,新聚類中心為當聚類內距離其他軌跡LCKFD值之和最小的軌跡;步驟S10:計算當前每條軌跡與自身所在聚類的中心的LCKFD值之和SumL;步驟S11:如果當前的SumL比之前劃分得到的SumL值更小,則記錄當前的Clusters為最好聚類劃分效果BestC;步驟S12:K值自增加1;步驟S13:若K小于等于m/2,則執行步驟S5,否則執行步驟S14;步驟S14:對于最佳聚類結果BestC中的每個聚類cluster,計算該聚類的稀疏軌跡判別閾值length;步驟S15:遍歷每個聚類內的每條軌跡數據,將遍歷到的長度小于所屬聚類的稀疏軌跡判別閾值length的軌跡轉步驟S16進行軌跡補全;步驟S16:利用當前軌跡所在聚類,對該稀疏軌跡進行補全。2.根據權利要求1所述的軌跡補全方法,其特征在于,步驟S3具體包括:步驟S301:初始化當前軌跡點索引i為1,上一次劃分點索引j為1,當前軌跡為{p
j
,...,p
n
},當前軌跡的車輛編號為vid;步驟S302:如果i等于當前軌跡長度,則結束對當前軌跡的劃分,并且如果i大于1,將當前軌跡以鍵值對的形式:{vid+p
j
.time:{p
j
,...,p
i
}}加入軌跡數據集合Trajs,繼續劃分剩余未劃分過的軌跡,直至劃分完所有軌跡數據;步驟S303:確定當前軌跡Traj的相鄰的兩個軌跡點p
i
與p
i+1
,是否同為車輛停靠點,若是則轉步驟S304;否則則使i自增加1,轉步驟S302;步驟S304:在車輛停靠點的軌跡點處將軌跡進行分割,將鍵值對{vid+p
j
.time:
{p
j
,...,p
i
}}加入Trajs中;步驟S305:遍歷剩余軌跡點{p
i+1
,...,p
n
},找到第一個不與p
i+1
同為停靠點的軌跡點p
k
,令j=k,轉步驟S302。3.根據權利要求2所述的軌跡補全方法,其特征在于,若當前軌跡Traj的相鄰的兩個軌跡點p
i
與p
i+1
滿足下述關系式,則稱p
i
與p
i+1
同為車輛停靠點:4.根據權利要求1所述的軌跡補全方法,其特征在于,步驟S5采用基于起止點的軌跡聚類初始中心點選取方法,具體包括:步驟S501:隨機選取一條軌跡數據加入聚類中心集合C:{C1};步驟S502:設當前集合C中聚類中心數量為o,計算除聚類中心外的每條軌跡數據Traj{p1,...,p
n
}與集合C內每個聚類中心的起點p1和終點p
n
的歐式距離之和,選取距離之和最小的軌跡數據作為新的聚類中心C
new
;步驟S503:將C
new
加入集合C中,聚類中心數量o設置為o+1;步驟S504:如果o小于K,則轉步驟S502,否則結束。5.根據權利要求4所述的軌跡補全方法,其特征在于,新的聚類中心C
new
的計算式如下:6.根據權利要求1所述的軌跡補全方法,其特征在于,步驟S6采用軌跡數據之間相似性度量方法確定LCKFD,具體包括:步驟S601:計算軌跡數據Traj{p1,...,p
n1
}和聚類中心C{p1,...,p
n2
}的Husdorff距離作為相似點閾值ε:步驟S602:構造輔...
【專利技術屬性】
技術研發人員:關永勝,葛建軍,張可,陳偉明,
申請(專利權)人:電子科技大學長三角研究院湖州,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。