本發(fā)明專利技術(shù)涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法,具體包括:實(shí)時(shí)接入原始的軌跡數(shù)據(jù);對原始的軌跡數(shù)據(jù)進(jìn)行校驗(yàn);對通過校驗(yàn)的軌跡數(shù)據(jù)進(jìn)行分組,得到數(shù)據(jù)集合;對數(shù)據(jù)集合進(jìn)行排序和批次劃分,得到數(shù)據(jù)批次集合;篩選得到其他類型關(guān)聯(lián)數(shù)據(jù)集合;對數(shù)據(jù)批次集合和其他類型關(guān)聯(lián)數(shù)據(jù)集合進(jìn)行兩兩關(guān)聯(lián),得到任意兩類數(shù)據(jù)在同一時(shí)空范圍內(nèi)的關(guān)聯(lián)關(guān)系檔案;對關(guān)聯(lián)關(guān)系檔案按天進(jìn)行存儲,并將每天的結(jié)果合并得到總關(guān)聯(lián)結(jié)果。本發(fā)明專利技術(shù)在任意選擇的時(shí)間范圍內(nèi)對海量的車輛、人像和IMSI數(shù)據(jù)實(shí)現(xiàn)實(shí)時(shí)、高效且準(zhǔn)確的關(guān)聯(lián)建檔,為工作提供數(shù)據(jù)支撐。為工作提供數(shù)據(jù)支撐。為工作提供數(shù)據(jù)支撐。
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法
[0001]本專利技術(shù)涉及數(shù)據(jù)處理
,尤其涉及一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法。
技術(shù)介紹
[0002]基于車牌、手機(jī)和人臉圖像數(shù)據(jù)查找實(shí)名人信息技術(shù)是現(xiàn)比較常用的技術(shù)手段,但在實(shí)際的過程中,由于用戶信息、車輛信息、IMSI信息以及人像信息都是獨(dú)立存儲,只采用某一種技術(shù)手段可能會出現(xiàn)數(shù)據(jù)缺失,進(jìn)而導(dǎo)致工作難以推進(jìn)的問題。例如:通過車牌或手機(jī)的實(shí)名信息查找到登記人的基本信息,但是在實(shí)際生活中,經(jīng)常會出現(xiàn)登記人和使用人不是同一個(gè)人的情況,因此通過這種方式得到的結(jié)果極有可能不準(zhǔn)確;或者是借助人臉照片查找實(shí)名人信息,但是這種方式的前提是必須有視頻或者照片,如果沒有圖片數(shù)據(jù),就無法找到實(shí)名人的基本信息。由此可見如果能夠?qū)囕v、人像和IMSI信息的軌跡數(shù)據(jù)進(jìn)行關(guān)聯(lián)建檔,利用關(guān)聯(lián)建檔實(shí)現(xiàn)數(shù)據(jù)互補(bǔ)達(dá)到完善數(shù)據(jù)的目的,這有助于實(shí)現(xiàn)快速掌握實(shí)名人的身份及行蹤信息。
[0003]南京中新賽克科技有限責(zé)任公司公開了申請?zhí)枮镃N202111623716.3的一種基于手機(jī)和人像的圖碼匹配建檔方法和介質(zhì),首先對原始人像軌跡數(shù)據(jù)和手機(jī)軌跡數(shù)據(jù)進(jìn)行預(yù)處理,生成人像開始時(shí)間和人像結(jié)束時(shí)間;對預(yù)處理后的人像數(shù)據(jù)和手機(jī)數(shù)據(jù)進(jìn)行匹配分析;然后對處理后的數(shù)據(jù)進(jìn)行匹配打分,生成每天的匹配打分結(jié)果;將每天的匹配打分結(jié)果和歷史的匹配打分結(jié)果進(jìn)行合并,得到總的匹配打分結(jié)果,基于總的匹配打分結(jié)果計(jì)算出人像和手機(jī)號匹配的置信度,根據(jù)置信度結(jié)果分析人像和手機(jī)號是否建檔。
[0004]在上述算法中,數(shù)據(jù)檔案關(guān)系的建立對每天的匹配打分和置信度結(jié)果有較強(qiáng)的依賴,檔案關(guān)聯(lián)關(guān)系不是實(shí)時(shí)建立的,存在較長時(shí)間的滯后性,在實(shí)際應(yīng)用中,如果相應(yīng)查看案件發(fā)生前后一段時(shí)間內(nèi)的數(shù)據(jù)關(guān)聯(lián)檔案,極有可能會出現(xiàn)沒有關(guān)聯(lián)或者是錯(cuò)誤關(guān)聯(lián)的情況。
技術(shù)實(shí)現(xiàn)思路
[0005]針對現(xiàn)有技術(shù)中數(shù)據(jù)檔案關(guān)系的建立對每天的匹配打分和置信度結(jié)果有較強(qiáng)的依賴,檔案關(guān)聯(lián)關(guān)系不是實(shí)時(shí)建立的,存在較長時(shí)間的滯后性,在實(shí)際應(yīng)用中,如果相應(yīng)查看案件發(fā)生前后一段時(shí)間內(nèi)的數(shù)據(jù)關(guān)聯(lián)檔案,極有可能會出現(xiàn)沒有關(guān)聯(lián)或者是錯(cuò)誤關(guān)聯(lián)的情況,本專利技術(shù)提出了一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法,其目的是在任意選擇的時(shí)間范圍內(nèi)對海量的車輛、人像和IMSI數(shù)據(jù)實(shí)現(xiàn)實(shí)時(shí)、高效且準(zhǔn)確的關(guān)聯(lián)建檔,為工作提供數(shù)據(jù)支撐。
[0006]為了實(shí)現(xiàn)上述目的,本專利技術(shù)通過如下的技術(shù)方案來實(shí)現(xiàn):一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法,包括:步驟1:實(shí)時(shí)接入原始的軌跡數(shù)據(jù);步驟2:對原始的軌跡數(shù)據(jù)進(jìn)行校驗(yàn);
步驟3:對通過校驗(yàn)的軌跡數(shù)據(jù)進(jìn)行分組,得到數(shù)據(jù)集合;步驟4:對數(shù)據(jù)集合進(jìn)行排序和批次劃分,得到數(shù)據(jù)批次集合;步驟5:篩選得到其他類型關(guān)聯(lián)數(shù)據(jù)集合;步驟6:對數(shù)據(jù)批次集合和其他類型關(guān)聯(lián)數(shù)據(jù)集合進(jìn)行兩兩關(guān)聯(lián),得到任意兩類數(shù)據(jù)在同一時(shí)空范圍內(nèi)的關(guān)聯(lián)關(guān)系檔案。
[0007]作為本專利技術(shù)的一種優(yōu)選方案,所述步驟1中實(shí)時(shí)接入原始的軌跡數(shù)據(jù),具體地,實(shí)時(shí)從Kafka中接入采集的軌跡數(shù)據(jù),并判斷所述軌跡數(shù)據(jù)是否為空,若軌跡數(shù)據(jù)為空則重新接入。
[0008]作為本專利技術(shù)的一種優(yōu)選方案,所述原始的軌跡數(shù)據(jù)分為原始人像軌跡數(shù)據(jù)、原始IMSI軌跡數(shù)據(jù)和原始車輛軌跡數(shù)據(jù)三種數(shù)據(jù)類型,具體包括設(shè)備類型、設(shè)備編號、采集頻率、采集半徑、采集時(shí)間、實(shí)名身份信息、人臉圖片信息、車牌圖片信息和IMSI信息。
[0009]作為本專利技術(shù)的一種優(yōu)選方案,所述步驟2中對原始的軌跡數(shù)據(jù)進(jìn)行校驗(yàn),校驗(yàn)所述原始的軌跡數(shù)據(jù)本身的值是否符合要求,以及采集時(shí)間是否是最新時(shí)間;具體包括:根據(jù)采集時(shí)間計(jì)算所述軌跡數(shù)據(jù)所屬的日期,根據(jù)設(shè)備編號計(jì)算所述軌跡數(shù)據(jù)所屬的采集設(shè)備組合,然后計(jì)算當(dāng)前采集設(shè)備組合在該日期最新的數(shù)據(jù)采集時(shí)間,來判斷所述軌跡數(shù)據(jù)是否是過期數(shù)據(jù),若是過期數(shù)據(jù)則放入廢棄隊(duì)列,若不是過期數(shù)據(jù)則進(jìn)行數(shù)據(jù)緩存;對于通過校驗(yàn)的軌跡數(shù)據(jù),按照數(shù)據(jù)類型進(jìn)行分組緩存,用作實(shí)時(shí)計(jì)算;對于未通過校驗(yàn)的軌跡數(shù)據(jù),按照設(shè)備類型進(jìn)行備份存儲,用作補(bǔ)償計(jì)算。
[0010]作為本專利技術(shù)的一種優(yōu)選方案,所述步驟3中,對通過校驗(yàn)的軌跡數(shù)據(jù)進(jìn)行分組,具體地,讀取緩存中的所有軌跡數(shù)據(jù),分別根據(jù)設(shè)備編號進(jìn)行分組,得到每個(gè)采集設(shè)備所對應(yīng)采集的數(shù)據(jù)集合。
[0011]作為本專利技術(shù)的一種優(yōu)選方案,所述步驟4中,對數(shù)據(jù)集合進(jìn)行排序和批次劃分,具體地,對步驟3中的數(shù)據(jù)集合進(jìn)行遍歷,將同一個(gè)采集設(shè)備采集到的軌跡數(shù)據(jù)按照采集時(shí)間由小到大進(jìn)行排序,根據(jù)采集設(shè)備的采集頻率,對已排序的軌跡數(shù)據(jù)進(jìn)行批次劃分,得到不同軌跡數(shù)據(jù)的數(shù)據(jù)批次集合;對所述數(shù)據(jù)批次集合進(jìn)行遍歷,將同一批次的軌跡數(shù)據(jù)進(jìn)行去重處理和常駐數(shù)據(jù)剔除處理,得到無重復(fù)的數(shù)據(jù)批次集合,同時(shí)得到批次對應(yīng)的采集時(shí)間范圍,即該批次采集的開始時(shí)間和結(jié)束時(shí)間。
[0012]作為本專利技術(shù)的一種優(yōu)選方案,所述步驟5中,篩選得到其他類型關(guān)聯(lián)數(shù)據(jù)集合,具體包括:根據(jù)其中一個(gè)采集設(shè)備編號,篩選得到該設(shè)備有效采集半徑范圍內(nèi)的其他類型的關(guān)聯(lián)設(shè)備編號,根據(jù)所述其他類型的關(guān)聯(lián)設(shè)備編號和批次對應(yīng)的采集時(shí)間范圍,篩選得到其他類型的關(guān)聯(lián)設(shè)備在該采集時(shí)間范圍內(nèi)采集到的數(shù)據(jù)集合,即其他類型關(guān)聯(lián)數(shù)據(jù)集合,對所述其他類型關(guān)聯(lián)數(shù)據(jù)集合進(jìn)行去重處理和常駐數(shù)據(jù)剔除處理,得到無重復(fù)數(shù)據(jù)的其他類型關(guān)聯(lián)數(shù)據(jù)集合。
[0013]作為本專利技術(shù)的一種優(yōu)選方案,還包括:對所述關(guān)聯(lián)關(guān)系檔案按天進(jìn)行存儲,并將每天的結(jié)果合并得到總關(guān)聯(lián)結(jié)果。
[0014]與現(xiàn)有技術(shù)相比,本專利技術(shù)具有的有益效果是:本專利技術(shù)提出的方法將車輛、人像和IMSI數(shù)據(jù)進(jìn)行兩兩建檔,具有實(shí)時(shí)性高、可靠性高、可控性強(qiáng)、動態(tài)可調(diào)等優(yōu)點(diǎn),數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系可以根據(jù)每個(gè)設(shè)備的采集頻率和有效采集范圍進(jìn)行動態(tài)調(diào)整。
[0015]本專利技術(shù)所提出的一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法,最大限度保
留了車輛、人臉與IMSI的原始時(shí)空狀態(tài),并還原了車輛、人臉與IMSI產(chǎn)生碰撞時(shí)的關(guān)聯(lián)狀態(tài),同時(shí)利用數(shù)據(jù)批次對采集數(shù)據(jù)進(jìn)行正向去重和根據(jù)常駐數(shù)據(jù)對采集數(shù)據(jù)進(jìn)行反向剔除的機(jī)制,對駐留這種復(fù)雜場景具有很強(qiáng)的魯棒性,即使多次重復(fù)采集也會得到正確的關(guān)聯(lián)關(guān)系。
附圖說明
[0016]為了更清楚地說明本專利技術(shù)實(shí)施例的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術(shù)的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。其中:圖1為本專利技術(shù)優(yōu)選實(shí)施例中的方法流程圖;圖2為本專利技術(shù)優(yōu)選實(shí)施例中的數(shù)據(jù)校驗(yàn)流程圖;圖3為本專利技術(shù)優(yōu)選實(shí)施例中的數(shù)據(jù)處理流程圖。
具體實(shí)施方式
[0017]為使本專利技術(shù)實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本專利技術(shù)實(shí)施例的附圖,對本專利技術(shù)實(shí)施例的技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例是本專利技術(shù)的一部分實(shí)施例,而不是全部的實(shí)施例。基于所描述的本專利技術(shù)的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本專利技術(shù)保護(hù)的范圍。
[0018]實(shí)施例1本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法,其特征在于,所述方法包括:步驟1:實(shí)時(shí)接入原始的軌跡數(shù)據(jù);步驟2:對原始的軌跡數(shù)據(jù)進(jìn)行校驗(yàn);步驟3:對通過校驗(yàn)的軌跡數(shù)據(jù)進(jìn)行分組,得到數(shù)據(jù)集合;步驟4:對數(shù)據(jù)集合進(jìn)行排序和批次劃分,得到數(shù)據(jù)批次集合;步驟5:篩選得到其他類型關(guān)聯(lián)數(shù)據(jù)集合;步驟6:對數(shù)據(jù)批次集合和其他類型關(guān)聯(lián)數(shù)據(jù)集合進(jìn)行兩兩關(guān)聯(lián),得到任意兩類數(shù)據(jù)在同一時(shí)空范圍內(nèi)的關(guān)聯(lián)關(guān)系檔案。2.如權(quán)利要求1所述的一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法,其特征在于,所述步驟1中實(shí)時(shí)接入原始的軌跡數(shù)據(jù),具體地,實(shí)時(shí)從Kafka中接入采集的軌跡數(shù)據(jù),并判斷所述軌跡數(shù)據(jù)是否為空,若軌跡數(shù)據(jù)為空則重新接入。3.如權(quán)利要求2所述的一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法,其特征在于,所述原始的軌跡數(shù)據(jù)分為原始人像軌跡數(shù)據(jù)、原始IMSI軌跡數(shù)據(jù)和原始車輛軌跡數(shù)據(jù)三種數(shù)據(jù)類型,具體包括設(shè)備類型、設(shè)備編號、采集頻率、采集半徑、采集時(shí)間、實(shí)名身份信息、人臉圖片信息、車牌圖片信息和IMSI信息。4.如權(quán)利要求3所述的一種基于車圖碼軌跡多維關(guān)聯(lián)實(shí)時(shí)建檔的計(jì)算方法,其特征在于,所述步驟2中對原始的軌跡數(shù)據(jù)進(jìn)行校驗(yàn),校驗(yàn)所述原始的軌跡數(shù)據(jù)本身的值是否符合要求,以及采集時(shí)間是否是最新時(shí)間;具體包括:根據(jù)采集時(shí)間計(jì)算所述軌跡數(shù)據(jù)所屬的日期,根據(jù)設(shè)備編號計(jì)算所述軌跡數(shù)據(jù)所屬的采集設(shè)備組合,然后計(jì)算當(dāng)前采集設(shè)備組合在該日期最新的數(shù)據(jù)采集時(shí)間,來判斷所述軌跡數(shù)據(jù)是否是過期數(shù)據(jù),若是過期數(shù)據(jù)則放入廢棄隊(duì)列,若不是過期數(shù)據(jù)則進(jìn)行數(shù)據(jù)緩存;對于通過校驗(yàn)的軌跡數(shù)據(jù),按照數(shù)據(jù)類型進(jìn)行分組緩存,用作實(shí)時(shí)計(jì)算;對于未通...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:胡業(yè)勇,顏丙虎,張鵬,
申請(專利權(quán))人:南京小唐安樸科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。