本申請?zhí)峁┝艘环N人群分類方法以及人群分類裝置,其中,該方法包括:獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息;根據(jù)每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,獲取每個所述待分類個體的行動軌跡信息;基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類。基于這種覆蓋面更廣,也更加全面的移動軌跡信息來對群體特征進(jìn)行挖掘,能夠得到準(zhǔn)確度更高的挖掘結(jié)果。
A method of population classification and its device
【技術(shù)實現(xiàn)步驟摘要】
一種人群分類方法以及人群分類裝置
本申請涉及數(shù)據(jù)分析
,具體而言,涉及一種人群分類方法以及人群分類裝置。
技術(shù)介紹
個人移動的特征是挖掘群體特征的前提,個人出行的模式,是挖掘和實現(xiàn)城市數(shù)據(jù)帶來的巨大社會價值和行業(yè)價值,研究和解決城市信息資源的重要問題。在基于個人移動特征對群體特征進(jìn)行挖掘的時候,首先要基于個人移動特征對人群進(jìn)行分類,為了能夠獲得準(zhǔn)確的挖掘結(jié)果,要獲得在一定區(qū)域范圍內(nèi)活動的個人的行動軌跡信息。獲個人的行動軌跡信息時,在盡可能多的覆蓋到在該區(qū)域內(nèi)活動的個人,同時還要針對每個個人,盡可能全面的獲取其行動軌跡信息。在相關(guān)技術(shù)中,一般通過獲取個人對交通工具的使用信息來確定其行動軌跡信息。但是個人在出行的時候,可能使用公共交通工具,如公交、地鐵等,可能使用私人交通工具,如私家車,也可能不使用交通工具,如步行。對于使用私人交通工具出行和不使用交通工具出行的個人而言,是很難獲取其行動軌跡信息的;且對于主要使用公共交通工具出行的人而言,其也并非是一直使用公共交通工具出行的。因而這種行動軌跡信息的獲取方法獲取存在準(zhǔn)確性和全面性差的問題,導(dǎo)致挖掘結(jié)果的準(zhǔn)確度低。
技術(shù)實現(xiàn)思路
有鑒于此,本申請實施例的目的在于提供一種人群分類方法以及人群分類裝置,能夠基于個體對通信基站的使用情況來確定個人的行動軌跡信息,并基于行動軌跡信息對人群進(jìn)行分類,基于這種分類結(jié)果對人群特征進(jìn)行挖掘,能夠提高挖掘結(jié)果的準(zhǔn)確度。第一方面,本申請實施例提供了一種人群分類方法,包括:獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息;根據(jù)每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,獲取每個所述待分類個體的行動軌跡信息;基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類。可選地,所述獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息之前,還包括:確定目標(biāo)區(qū)域范圍;將地理位置歸屬于所述目標(biāo)區(qū)域范圍的多個通信基站確定為預(yù)設(shè)通信基站;以及,將使用所述預(yù)設(shè)通信基站的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閾值的個體,確定為所述待分類個體。可選地,所述使用信息包括:連接建立時間;所述獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,具體包括:針對每個待分類個體,獲取預(yù)設(shè)歷史時間段內(nèi),該待分類個體與各個預(yù)設(shè)通信基站的連接建立時間;所述根據(jù)每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,獲取每個所述待分類個體的行動軌跡信息,具體包括:針對每個待分類個體,按照該待分類個體與各個預(yù)設(shè)通信基站之間連接建立時間的先后順序,以及每個預(yù)設(shè)通信基站的位置信息,生成該待分類個體的行動軌跡信息。可選地,所述基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類,具體包括:基于所述各個待分類個體的行動軌跡信息,對所述待分類人群中的各個所述待分類個體進(jìn)行聚類,獲得多個所述分類。可選地,所述基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類之后,還包括:針對每個分類,基于該分類中所包括的各個待分類個體對各個預(yù)設(shè)通信基站的使用次數(shù)信息,對該分類中所包括的多個待分類個體進(jìn)行分類,獲得與該分類對應(yīng)的至少一個子分類;所述使用次數(shù)信息包括:連接建立頻次或者連接建立次數(shù)。可選地,所述基于該分類中所包括的各個待分類個體對多個預(yù)設(shè)通信基站的使用次數(shù)信息,對該分類中所包括的多個待分類個體進(jìn)行分類,具體包括:針對每個待分類個體,獲取該待分類個體與各個預(yù)設(shè)通信基站之間的連接建立時間;針對每個預(yù)設(shè)通信基站,統(tǒng)計該待分類個體與該預(yù)設(shè)通信基站之間的連接建立時間落入預(yù)設(shè)歷史時間段內(nèi)的使用次數(shù)信息;基于該分類中所包括的各個待分類個體與各個預(yù)設(shè)通信基站的使用次數(shù)信息,對該分類中所包括的多個待分類個體進(jìn)行聚類,獲得多個子分類。可選地,所述基于該分類中所包括的各個待分類個體與各個預(yù)設(shè)通信基站的使用次數(shù)信息之間的相似度,對該分類中所包括的多個待分類個體進(jìn)行聚類,具體包括:基于該分類中所包括的各個待分類個體與各個預(yù)設(shè)通信基站的使用次數(shù)信息,建立該分類中所包括的各個待分類個體對應(yīng)的次數(shù)特征向量;使用預(yù)設(shè)的聚類算法,并基于該分類中包括的各個待分類個體對應(yīng)的次數(shù)特征向量,對該分類中所包括的所有待分類個體進(jìn)行聚類。可選地,基于該分類中所包括的各個待分類個體與各個預(yù)設(shè)通信基站的連接建立次數(shù),建立該分類中所包括的各個待分類個體對應(yīng)的次數(shù)特征向量之前,還包括:對該分類中所包括的各個待分類個體與各個預(yù)設(shè)通信基站的連接建立次數(shù)進(jìn)行去干擾處理;基于該分類中所包括的各個待分類個體與各個預(yù)設(shè)通信基站的連接建立次數(shù),建立該分類中所包括的各個待分類個體對應(yīng)的次數(shù)特征向量,具體包括:基于去干擾處理的結(jié)果,建立該分類中所包括的各個待分類個體對應(yīng)的次數(shù)特征向量。可選地,所述對該分類中所包括的各個待分類個體與各個預(yù)設(shè)通信基站的連接建立次數(shù)進(jìn)行去干擾處理,具體包括:將該分類中所包括的各個待分類個體與各個預(yù)設(shè)通信基站的連接建立次數(shù)對數(shù)化;所述連接建立次數(shù)對數(shù)化后,小于預(yù)設(shè)閾值的預(yù)設(shè)通信基站的連接建立次數(shù)歸零。第二方面,本申請實施例還提供一種人群分類裝置,該裝置包括:獲取單元,用于獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用時間信息;行動軌跡計算單元,用于根據(jù)每一個待分類個體對多個預(yù)設(shè)通信基站的使用時間信息,獲取每個所述待分類個體的行動軌跡信息;分類單元,用于基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類。可選地,還包括:確定單元,用于獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息之前,確定目標(biāo)區(qū)域范圍;將地理位置歸屬于所述目標(biāo)區(qū)域范圍的多個通信基站確定為預(yù)設(shè)通信基站;以及,將使用所述預(yù)設(shè)通信基站的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閾值的個體,確定為所述待分類個體。可選地,所述使用信息包括:連接建立時間;獲取單元具體用于通過采取下述方式獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息:針對每個待分類個體,獲取預(yù)設(shè)歷史時間段內(nèi),該待分類個體與各個預(yù)設(shè)通信基站的連接建立時間;行動軌跡計算單元具體用于通過采取下述方式根據(jù)每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,獲取每個所述待分類個體的行動軌跡信息:針對每個待分類個體,按照該待分類個體與各個預(yù)設(shè)通信基站之間連接建立時間的先后順序,以及每個預(yù)設(shè)通信基站的位置信息,生成該待分類個體的行動軌跡信息。可選地,分類單元具體用于通過采取下述方式基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類:基于所述各個待分類個體的行動軌跡信息,對所述待分類人群中的各個所述待分類個體進(jìn)行聚類,獲得多個所述分類。可選地,分類單元,還用于基于各個所述待分類個體的行動軌跡信息,本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種人群分類方法,其特征在于,包括:/n獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息;/n根據(jù)每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,獲取每個所述待分類個體的行動軌跡信息;/n基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類。/n
【技術(shù)特征摘要】
1.一種人群分類方法,其特征在于,包括:
獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息;
根據(jù)每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,獲取每個所述待分類個體的行動軌跡信息;
基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息之前,還包括:
確定目標(biāo)區(qū)域范圍;
將地理位置歸屬于所述目標(biāo)區(qū)域范圍的多個通信基站確定為預(yù)設(shè)通信基站;
以及,將使用所述預(yù)設(shè)通信基站的數(shù)量達(dá)到預(yù)設(shè)數(shù)量閾值的個體,確定為所述待分類個體。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述使用信息包括:連接建立時間;
所述獲取待分類人群中每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,具體包括:
針對每個待分類個體,獲取預(yù)設(shè)歷史時間段內(nèi),該待分類個體與各個預(yù)設(shè)通信基站的連接建立時間;
所述根據(jù)每一個待分類個體對多個預(yù)設(shè)通信基站的使用信息,獲取每個所述待分類個體的行動軌跡信息,具體包括:
針對每個待分類個體,按照該待分類個體與各個預(yù)設(shè)通信基站之間連接建立時間的先后順序,以及每個預(yù)設(shè)通信基站的位置信息,生成該待分類個體的行動軌跡信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類,具體包括:
基于所述各個待分類個體的行動軌跡信息,對所述待分類人群中的各個所述待分類個體進(jìn)行聚類,獲得多個所述分類。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于各個所述待分類個體的行動軌跡信息,將所述待分類人群劃分成多個分類之后,還包括:
針對每個分類,基于該分類中所包括的各個待分類個體對各個預(yù)設(shè)通信基站的使用次數(shù)信息,對該分類中所包括的多個待分類個體進(jìn)行分類,獲得與該分類對應(yīng)的至少一個子分類;
所述使用次數(shù)信息包括:連接建立頻次或者連接建立次數(shù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于該分類中所包括的各個待分類個體對多個預(yù)設(shè)通信基站的使用次數(shù)信息,對該分類中所包括的多個待分類個體進(jìn)行分類,具體包括:<...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:楊鴻賓,李長升,段立新,夏虎,
申請(專利權(quán))人:國信優(yōu)易數(shù)據(jù)有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。