本發(fā)明專利技術(shù)公開了一種興趣點的標(biāo)注方法以及裝置。其中,該方法包括:接收多個用戶上傳的多個興趣點數(shù)據(jù);采用聚類算法將多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域;分別將多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結(jié)果集;根據(jù)多個聚類結(jié)果集對存在興趣點的位置區(qū)域進行標(biāo)注。該方法利用用戶上傳的海量的POI的位置及屬性信息,快速準(zhǔn)確地挖掘出POI點,節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及地理信息處理
,尤其涉及一種興趣點的標(biāo)注方法以及裝置。
技術(shù)介紹
興趣點(POI,PointOfInterest)是地理信息系統(tǒng)中的一個術(shù)語,泛指一切可以抽象為點的地理對象,尤其是一些與人們生活密切相關(guān)的地理實體,如學(xué)校、銀行、餐館、加油站、醫(yī)院、超市等。興趣點的主要用途是對事物或事件的地址進行描述,能在很大程度上增強對事物或事件位置的描述能力和查詢能力,提高地理定位的精度和速度。相關(guān)技術(shù)中,興趣點的采集方法通常是由數(shù)據(jù)提供商通過采集人員攜帶相關(guān)設(shè)備直接進行外業(yè)采集,之后將采集到的數(shù)據(jù)經(jīng)過數(shù)據(jù)處理后提供給需求方。但是,目前存在的問題是,通過上述這種人工外業(yè)采集的方式,往往需要數(shù)月才能更新地圖中的POI數(shù)據(jù),顯然無法滿足實時性需求,并且,通過人工進行大規(guī)模的外業(yè)數(shù)據(jù)采集,會導(dǎo)致采集成本高、效率低。
技術(shù)實現(xiàn)思路
本專利技術(shù)的目的旨在至少在一定程度上解決上述的技術(shù)問題之一。為此,本專利技術(shù)的第一個目的在于提出一種興趣點的標(biāo)注方法。該方法利用用戶上傳的海量的POI的位置及屬性信息,快速準(zhǔn)確地挖掘出POI點,節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。本專利技術(shù)的第二個目的在于提出一種興趣點的標(biāo)注裝置。為達到上述目的,本專利技術(shù)第一方面實施例提出的興趣點的標(biāo)注方法,包括:接收多個用戶上傳的多個興趣點數(shù)據(jù);采用聚類算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域;分別將所述多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結(jié)果集;根據(jù)所述多個聚類結(jié)果集對存在興趣點的位置區(qū)域進行標(biāo)注。本專利技術(shù)實施例的興趣點的標(biāo)注方法,可接收多個用戶上傳的多個興趣點數(shù)據(jù),并采用聚類算法將多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域,并分別將多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結(jié)果集,最后,根據(jù)多個聚類結(jié)果集對存在興趣點的位置區(qū)域進行標(biāo)注。即通過接收用戶上傳的大量興趣點數(shù)據(jù),并將用戶上傳的大量興趣點數(shù)據(jù)進行二次聚類,最終根據(jù)二次聚類后的結(jié)果實現(xiàn)對存在興趣點的位置區(qū)域進行標(biāo)注,這種方式可以快速準(zhǔn)確地挖掘POI點,節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。本專利技術(shù)的第二個目的在于提出一種興趣點的標(biāo)注裝置,包括:接收模塊,用于接收多個用戶上傳的多個興趣點數(shù)據(jù);第一聚類模塊,用于采用聚類算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域;第二聚類模塊,用于分別將所述多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結(jié)果集;標(biāo)注模塊,用于根據(jù)所述多個聚類結(jié)果集對存在興趣點的位置區(qū)域進行標(biāo)注。本專利技術(shù)實施例的興趣點的標(biāo)注裝置,可通過接收模塊接收多個用戶上傳的多個興趣點數(shù)據(jù),第一聚類模塊采用聚類算法將多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域,第二聚類模塊分別將多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結(jié)果集,標(biāo)注模塊根據(jù)多個聚類結(jié)果集對存在興趣點的位置區(qū)域進行標(biāo)注。即通過接收用戶上傳的大量興趣點數(shù)據(jù),并將用戶上傳的大量興趣點數(shù)據(jù)進行二次聚類,最終根據(jù)二次聚類后的結(jié)果實現(xiàn)對存在興趣點的位置區(qū)域進行標(biāo)注,這種方式可以快速準(zhǔn)確地挖掘POI點,節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。本專利技術(shù)附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術(shù)的實踐了解到。附圖說明本專利技術(shù)上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:圖1是根據(jù)本專利技術(shù)一個實施例的興趣點的標(biāo)注方法的流程圖;圖2是根據(jù)本專利技術(shù)一個實施例的Geo哈希字符串標(biāo)識位置區(qū)域的示意圖;圖3是根據(jù)本專利技術(shù)一個具體實施例的興趣點的標(biāo)注方法的流程圖;圖4是根據(jù)本專利技術(shù)一個實施例的興趣點的標(biāo)注裝置的結(jié)構(gòu)示意圖;圖5是根據(jù)本專利技術(shù)一個具體實施例的興趣點的標(biāo)注裝置的結(jié)構(gòu)示意圖;圖6是根據(jù)本專利技術(shù)另一個具體實施例的興趣點的標(biāo)注裝置的結(jié)構(gòu)示意圖。具體實施方式下面詳細描述本專利技術(shù)的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本專利技術(shù),而不能理解為對本專利技術(shù)的限制。下面參考附圖描述本專利技術(shù)實施例的興趣點的標(biāo)注方法以及裝置。圖1是根據(jù)本專利技術(shù)一個實施例的興趣點的標(biāo)注方法的流程圖。需要說明的是,本專利技術(shù)實施例的興趣點的標(biāo)注方法可應(yīng)用于本專利技術(shù)實施例的興趣點的標(biāo)注裝置,該標(biāo)注裝置可被配置于具有地圖功能的大數(shù)據(jù)平臺或云存儲平臺。該大數(shù)據(jù)平臺或云存儲平臺可利用本專利技術(shù)實施例的興趣點的標(biāo)注方法,對其為用戶提供的地圖應(yīng)用程序中的POI數(shù)據(jù)進行更新,即對地圖應(yīng)用程序中的存在有效興趣點的位置區(qū)域進行標(biāo)注,以實現(xiàn)對地圖應(yīng)用程序中地圖的更新。如圖1所示,該興趣點的標(biāo)注方法可以包括:S110,接收多個用戶上傳的多個興趣點數(shù)據(jù)。可以理解,為了能夠收集大量用戶上傳的興趣點數(shù)據(jù),作為一種示例,可預(yù)先為用戶提供上傳界面,該上傳界面可用于接收用戶填寫的興趣點數(shù)據(jù),并在接收到用戶的確認(rèn)上傳指令時,將用戶填寫的興趣點數(shù)據(jù)進行上傳。其中,該興趣點數(shù)據(jù)可包括但不限于興趣點的名稱、興趣點的經(jīng)緯度信息等。這樣,大量的用戶可通過該上傳界面將自己了解的興趣點數(shù)據(jù)進行上傳,以幫助后續(xù)根據(jù)用戶上傳的興趣點數(shù)據(jù)對存在有效興趣點的位置區(qū)域進行標(biāo)注。作為一種示例,可通過上述上傳界面實時接收大量用戶上傳的多個興趣點POI信息以及對應(yīng)的經(jīng)緯度信息。S120,采用聚類算法將多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域。作為一種示例,該位置信息可為經(jīng)緯度信息。具體地,可采用聚類算法將用戶上傳的大量興趣點數(shù)據(jù)按照經(jīng)緯度等位置信息進行一次聚類之后,可以將地理范圍分為多個區(qū)域,將位置相近的興趣點聚為一類,這些同類的興趣點共享一個位置區(qū)域,其中,該聚類算法可包括Geo哈希算法等。舉例而言,可采用Geo哈希算法將一定地理范圍內(nèi)的興趣點的經(jīng)度、緯度轉(zhuǎn)換為對應(yīng)的字符串,每個字符串不是代表一個點,而是代表了一個矩形區(qū)域,這個矩形區(qū)域內(nèi)的所有點都享有共同的Geo哈希位置信息。例如,如圖2所示,采用Geo哈希算法可將一定范圍內(nèi)的經(jīng)緯度點聚合到一起,其中,如圖2所示的字符串,即為該矩形區(qū)域內(nèi)的所有興趣點共同享有的Geo哈希位置信息。這樣,采用Geo哈希算法可將用戶上傳的多個興趣點數(shù)據(jù)按照位置信息進行聚類,得到多個聚類區(qū)域,每個聚類區(qū)域都有對應(yīng)的字符串進行表示。也就是說,可根據(jù)多個興趣點數(shù)據(jù)中的經(jīng)緯度信息,分別給每個興趣點編碼設(shè)置一個Geo哈希字符串,Geo哈希字符串標(biāo)識對應(yīng)興趣點數(shù)據(jù)的位置,然后,根據(jù)各個興趣點的Geo哈希字符串,采用Geo哈希算法將各個興趣點進行聚類。作為一種示例,假設(shè)一個興趣點數(shù)據(jù)中的經(jīng)緯度分別為116.389550和39.928167,則對經(jīng)緯度進行Geo哈希編碼的過程如下:地球緯度區(qū)間是[-90,90],可以通過下面算法對緯度39.928167進行逼近編碼:(1)將區(qū)間[-90,90]分為[-90,0)和[0,90],稱為左右區(qū)間,可以確定39.928167屬于右區(qū)間[0,90],給標(biāo)記為1;(2)接著將區(qū)間[0,90]進行二分為[0,45),本文檔來自技高網(wǎng)...

【技術(shù)保護點】
一種興趣點的標(biāo)注方法,其特征在于,包括以下步驟:接收多個用戶上傳的多個興趣點數(shù)據(jù);采用聚類算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域;分別將所述多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結(jié)果集;根據(jù)所述多個聚類結(jié)果集對存在興趣點的位置區(qū)域進行標(biāo)注。
【技術(shù)特征摘要】
1.一種興趣點的標(biāo)注方法,其特征在于,包括以下步驟:接收多個用戶上傳的多個興趣點數(shù)據(jù);采用聚類算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域;分別將所述多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結(jié)果集;根據(jù)所述多個聚類結(jié)果集對存在興趣點的位置區(qū)域進行標(biāo)注。2.如權(quán)利要求1所述的方法,其特征在于,所述分別將所述多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結(jié)果集,包括:針對每個聚類區(qū)域,計算所述每個聚類區(qū)域中的兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離相似性;將編輯距離相似性大于第一閾值的名稱所對應(yīng)的興趣點進行聚類,生成對應(yīng)的聚類結(jié)果集。3.如權(quán)利要求2所述的方法,其特征在于,所述計算所述每個聚類區(qū)域中的兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離相似性,包括:計算所述每個聚類區(qū)域中的兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離;根據(jù)所述兩兩興趣點數(shù)據(jù)中名稱的字符總數(shù)、以及所述編輯距離,計算所述兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離相似性。4.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述多個聚類結(jié)果集對存在興趣點的位置區(qū)域進行標(biāo)注,包括:針對每個聚類結(jié)果集,判斷所述每個聚類結(jié)果集中興趣點的個數(shù)是否大于或等于第二閾值;如果所述每個聚類結(jié)果集中興趣點的個數(shù)大于或等于所述第二閾值,則判定所述每個聚類結(jié)果集中存在有效興趣點;從所述每個聚類結(jié)果集中的興趣點數(shù)據(jù)中,隨機選取經(jīng)緯度信息,并將所述隨機選取的經(jīng)緯度信息作為所述存在有效興趣點的位置區(qū)域的坐標(biāo)。5.如權(quán)利要求1所述的方法,其特征在于,所述聚類算法為Geo哈希算法,所述位置信息為經(jīng)緯度信息。6.如權(quán)利要求5所述的方法,其特征在于,采用所述Geo哈希算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類時,采用的Geo哈希字符串的長度...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:高龍,
申請(專利權(quán))人:百度在線網(wǎng)絡(luò)技術(shù)北京有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。