本發明專利技術涉及一種基于大數據的畫像生成系統,包括第一數據庫、第二數據庫、第三數據庫、處理器和存儲有計算機程序的存儲器,當計算機程序被處理器執行時,實現步驟S1、從第一數據庫中獲取待測設備id的輸入特征信息,并輸入到設備id分類模型中,判斷是否為目標類型設備id,若是,則執行步驟S2;步驟S2、基于待測設備id、預設的第一時間段和待測設備id對應的目標地址從第二數據庫中獲取目標wifi ssid;步驟S3、基于目標wifi ssid和預設的第二時間段從第二數據庫中獲取目標設備id集合;步驟S4、基于目標設備id集合、第一數據庫和/或第二數據庫和/或第三數據庫生成目標畫像。本發明專利技術能夠準確全面地獲取小微企業的特征信息,提高了小微企業畫像的精確度。微企業畫像的精確度。微企業畫像的精確度。
【技術實現步驟摘要】
基于大數據的畫像生成系統
[0001]本專利技術涉及計算機
,尤其涉及一種基于大數據的畫像生成系統。
技術介紹
[0002]用戶畫像是一種勾畫目標用戶、聯系用戶訴求與設計方向的有效工具,隨著計算機技術以及大數據技術的不斷發展,用戶畫像已經各個領域得到了廣泛的應用。所謂用戶畫像,是指根據用戶社會屬性、生活習慣和消費行為等信息抽象出的標簽化的用戶模型。構建用戶畫像的核心工作即是給用戶貼“標簽”,而標簽是通過對用戶信息分析而來的高度精煉的特征標識。
[0003]企業作為社會經濟活動的主體,它涉及社會經濟活動的各個方面。相應的,人們對企業畫像(也即:企業級的用戶畫像)的需求也在不斷提高。針對中型企業或大企業,可以從大數據中獲取全面準確的企業信息構建企業畫像。小微企業是我國經濟和社會發展中的一支重要支撐力量,但是,由于小微企業較難獲取到準確全面的企業信息,因此很難構建準確的企業畫像,因此,如何基于大數據生成精確的小微企業畫像成為亟待解決的技術問題。
技術實現思路
[0004]本專利技術目的在于,提供一種基于大數據的畫像生成系統,能夠準確全面地獲取小微企業的特征信息,提高了小微企業畫像的精確度。
[0005]根據本專利技術第一方面,提供了一種基于大數據的畫像生成系統,包括第一數據庫、第二數據庫、第三數據庫、處理器和存儲有計算機程序的存儲器,其中,所述第一數據庫用于存儲設備id和設備id對應的特征信息和對應的時間信息,所述第二數據庫用于存儲設備id和設備id連接的wifi ssid信息、wifi位置信息和wifi連接時間信息,所述第三數據庫用于存儲設備id和設備id對應的標簽信息,當所述計算機程序被處理器執行時,實現以下步驟:步驟S1、從所述第一數據庫中獲取待測設備id對應的特征信息作為對應的輸入特征信息,并輸入預先訓練好的設備id分類模型中,判斷所述待測設備id是否為目標類型設備id,若是,則執行步驟S2,所述目標類型設備id為小微企業主的設備id;步驟S2、基于所述待測設備id、預設的第一時間段和待測設備id對應的目標地址從所述第二數據庫中獲取目標wifi ssid,所述目標地址為待測設備id對應的工作地,所述目標wifi ssid為待測設備id的工作地wifi ssid;步驟S3、基于所述目標wifi ssid和預設的第二時間段從所述第二數據庫中獲取所有目標設備id,構建目標設備id集合,所述目標設備id為所述待測設備id對應的小微企業的員工的設備id;步驟S4、基于所述目標設備id集合、所述第一數據庫和/或第二數據庫和/或第三數據庫生成目標畫像,所述目標畫像為所述待測設備id對應的小微企業的畫像。
[0006]本專利技術與現有技術相比具有明顯的優點和有益效果。借由上述技術方案,本專利技術
提供的一種基于大數據的畫像生成系統可達到相當的技術進步性及實用性,并具有產業上的廣泛利用價值,其至少具有下列優點:本專利技術通過設置三個數據庫,先判斷設備id是否為小微企業主的設備id,再通過小微企業主的設備id從第二數據庫中確定出小微企業的工作wifi,通過小微企業的工作wifi從第二數據庫中確定員工的設備id,最后通過員工的設備id從第一數據庫和/或第二數據庫和/或第三數據庫中獲取對應的特征或標簽,生成小微企業畫像,本專利技術能夠準確全面地獲取小微企業的特征信息,提高了生成小微企業畫像的準確度。
[0007]上述說明僅是本專利技術技術方案的概述,為了能夠更清楚了解本專利技術的技術手段,而可依照說明書的內容予以實施,并且為了讓本專利技術的上述和其他目的、特征和優點能夠更明顯易懂,以下特舉較佳實施例,并配合附圖,詳細說明如下。
附圖說明
[0008]圖1為本專利技術實施例提供的基于大數據的畫像生成系統示意圖。
具體實施方式
[0009]為更進一步闡述本專利技術為達成預定專利技術目的所采取的技術手段及功效,以下結合附圖及較佳實施例,對依據本專利技術提出的一種基于大數據的畫像生成系統的具體實施方式及其功效,詳細說明如后。
[0010]本專利技術實施例提供了一種基于大數據的畫像生成系統,如圖1所示,包括第一數據庫、第二數據庫、第三數據庫、處理器和存儲有計算機程序的存儲器,其中,所述第一數據庫用于存儲設備id和設備id對應的特征信息和對應的時間信息,設備id對應的特征信息可包括安裝APP的名稱、安裝APP的活躍特征、設備更換通信卡信息、家庭地信息、工作地信息等等。所述第二數據庫用于存儲設備id和設備id連接的wifi ssid信息、wifi位置信息和wifi連接時間信息,第二數據庫中每條記錄的字段可包括設備id、設備id連接的wifi ssid信息、wifi位置信息和wifi連接時間信息,其中,wifi ssid是每一wifi的唯一標識,wifi位置信息指的是wifi ssid對應的地理位置信息,例如可以為geohash信息,wifi連接時間信息是指每條記錄對應的連接時間信息。所述第三數據庫用于存儲設備id和設備id對應的標簽信息,標簽信息為預先計算出的設備id對應的人員信息的標簽,例如可以是年齡、性別、收入水平、消費能力等等。當所述計算機程序被處理器執行時,實現以下步驟:步驟S1、從所述第一數據庫中獲取待測設備id對應的特征信息作為對應的輸入特征信息,并輸入預先訓練好的設備id分類模型中,判斷所述待測設備id是否為目標類型設備id,若是,則執行步驟S2,所述目標類型設備id為小微企業主的設備id;其中,所述輸入特征信息包括以下特征的任意一個或任意多個的組合:預設的第三時間段內第一類預設APP的數量、預設的第三時間段內第一類預設APP的活躍特征、預設的第三時間段內設備穩定性特征、預設的第三時間段內對應的家庭地標簽數量、預設的第三時間段內對應的工作地標簽數量,所述第一類預設APP包括企業APP、工商APP和稅務APP中的一種或多種。
[0011]可以理解的是,由于小微企業信息的不易全面獲取,很多應用場景下,并不能直接獲知某一設備id是否為小微企業主設備id,因此可以通過步驟S1對待測設備id進行判斷。
當然,基于步驟S1可以將第一數據庫中所有的設備id進行判斷,批量篩選出小微企業主的設備id。
[0012]步驟S2、基于所述待測設備id、預設的第一時間段和待測設備id對應的目標地址從所述第二數據庫中獲取目標wifi ssid,所述目標地址為待測設備id對應的工作地,所述目標wifi ssid為待測設備id的工作地wifi ssid;其中,待測設備id對應的工作地可以直接通過現有的技術或方法直接獲取,例如通過已公開的信息平臺獲取,亦可通過線下定位的方式獲取小微企業真實的位置,本專利技術對此不作限定。第一時間段可以通過具體的應用需求來設定,例如可以設置為3個月。
[0013]步驟S3、基于所述目標wifi ssid和預設的第二時間段從所述第二數據庫中獲取所有目標設備id,構建目標設備id集合,所述目標設備id為所述待測設備id對應的小微企業的員工的設備id;其中,第二時間段可以與第一時間段相同,也可以不同,具體的根本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種基于大數據的畫像生成系統,其特征在于,包括第一數據庫、第二數據庫、第三數據庫、處理器和存儲有計算機程序的存儲器,其中,所述第一數據庫用于存儲設備id和設備id對應的特征信息和對應的時間信息,所述第二數據庫用于存儲設備id和設備id連接的wifi ssid信息、wifi位置信息和wifi連接時間信息,所述第三數據庫用于存儲設備id和設備id對應的標簽信息,當所述計算機程序被處理器執行時,實現以下步驟:步驟S1、從所述第一數據庫中獲取待測設備id對應的特征信息作為對應的輸入特征信息,并輸入預先訓練好的設備id分類模型中,判斷所述待測設備id是否為目標類型設備id,若是,則執行步驟S2,所述目標類型設備id為小微企業主的設備id;步驟S2、基于所述待測設備id、預設的第一時間段和待測設備id對應的目標地址從所述第二數據庫中獲取目標wifi ssid,所述目標地址為待測設備id對應的工作地,所述目標wifi ssid為待測設備id的工作地wifi ssid;步驟S3、基于所述目標wifi ssid和預設的第二時間段從所述第二數據庫中獲取所有目標設備id,構建目標設備id集合,所述目標設備id為所述待測設備id對應的小微企業的員工的設備id;步驟S4、基于所述目標設備id集合、所述第一數據庫和/或第二數據庫和/或第三數據庫生成目標畫像,所述目標畫像為所述待測設備id對應的小微企業的畫像。2.根據權利要求1所述的系統,其特征在于,當所述計算機程序被處理器執行時,還實現步驟S10、訓練得到所述設備id分類模型,具體包括:步驟S101、獲取多個小微企業主的設備id和多個非小微企業主的設備id,所述獲取的小微企業主的設備id為第一設備id,所獲取的非小微企業主的設備id為第二設備id;步驟S102、基于每一所述第一設備id從所述第一數據庫中獲取對應的特征信息作為對應的輸入特征信息,構建正樣本特征集合,基于每一所述第二設備id從所述第一數據庫中獲取對應的特征信息作為對應的輸入特征信息,構建負樣本特征集合;步驟S103、基于所述正樣本特征集合和負樣本特征集合訓練得到所述設備id分類模型。3.根據權利要求2所述的系統,其特征在于,所述步驟S101包括:步驟S111、從預設的小微企業主設備id集合中隨機抽取多個小微企業主的第一設備id;步驟S112、從所述第一數據庫中隨機抽取多個與所述第一設備id對應的特征信息相似度低于預設的相似度閾值的第二設備id。4.根據權利要求2所述的系統,其特征在于,所述設備id分類模型為邏輯回歸模型。5.根據權利要求1所述的系統,其特征在于,所述步驟S2包括:步驟S21、基于所述待測設備id、預設的第一時間段從所述第二數據庫中獲取所述待測設備id在所述第一時間段內連接過的連接頻率超過預設連接頻率閾值的所有wifi ssid,組...
【專利技術屬性】
技術研發人員:張靜雅,朱金星,葛丹妮,段力閣,
申請(專利權)人:北京云真信科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。