The application relates to the field of big data technology, and provides a user portrait generation method, device, computer equipment and storage medium. The methods include: obtaining the app data list of the target user, generating the eigenvector matrix with the eigenvector as the vector factor according to the characteristic parameters of each app in the app data list, obtaining the center vector matrix of each preset app vector matrix set, determining the relationship parameters between the eigenvector matrix and each center vector matrix, and determining the relationship parameters from each center vector matrix according to the relationship parameters The target vector matrix, taking the set of APP vector matrix where the target vector matrix is located as the target set, obtains the corresponding label information of the target set, generates the user profile of the target user according to the label information, realizes to determine the corresponding set of APP vector matrix through clustering simplification of a large number of app data of the target user, and obtains the simplified label information, so as to describe more accurately Describe the characteristics of the target user and improve the analysis efficiency of the user profile.
【技術(shù)實(shí)現(xiàn)步驟摘要】
用戶畫像生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
本申請(qǐng)涉及大數(shù)據(jù)
,特別是涉及一種用戶畫像生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。
技術(shù)介紹
隨著信息技術(shù)的發(fā)展,出現(xiàn)了用戶畫像分析技術(shù),用戶畫像是客觀、準(zhǔn)確地描述目標(biāo)用戶的工具和方法。在大數(shù)據(jù)時(shí)代背景下,用戶信息充斥在網(wǎng)絡(luò)中,將用戶的每個(gè)具體信息抽象成標(biāo)簽,利用這些標(biāo)簽將用戶形象具體化,從而為用戶提供有針對(duì)性的服務(wù)。在實(shí)際操作的過程中往往會(huì)以最為淺顯和貼近生活的話語(yǔ)將用戶的屬性、行為與期待聯(lián)結(jié)起來。作為實(shí)際用戶的虛擬代表,用戶畫像所形成的用戶角色并不是脫離產(chǎn)品和市場(chǎng)之外所構(gòu)建出來的,形成的用戶角色具有代表性,用戶畫像是真實(shí)用戶的虛擬代表,是根據(jù)目標(biāo)的行為觀點(diǎn)的差異區(qū)分為不同類型,迅速組織在一起,然后把新得出的類型提煉出來,形成一個(gè)類型的用戶畫像。現(xiàn)有技術(shù)中,大部分用戶畫像的生成方法采用關(guān)鍵詞提取方法來生成用戶標(biāo)簽,但通過采用關(guān)鍵字提取的方法進(jìn)行用戶畫像分析,對(duì)分析數(shù)據(jù)的數(shù)量具有一定的限制作用,當(dāng)分析數(shù)據(jù)的數(shù)據(jù)量巨大時(shí),會(huì)對(duì)應(yīng)產(chǎn)生大量的特征標(biāo)簽,這種分析方式會(huì)導(dǎo)致分析結(jié)果特征性不強(qiáng),分析效率低。
技術(shù)實(shí)現(xiàn)思路
基于此,有必要針對(duì)上述技術(shù)問題,提供一種能夠提高用戶畫像分析效率的用戶畫像生成方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。一種用戶畫像生成方法,所述方法包括:獲取目標(biāo)用戶的APP(Application的縮寫,應(yīng)用程序)數(shù)據(jù)列表;提取所述APP數(shù)據(jù)列表中各APP的特征參數(shù);以所述特征參數(shù)為向量因子 ...
【技術(shù)保護(hù)點(diǎn)】
1.一種用戶畫像生成方法,所述方法包括:/n獲取目標(biāo)用戶的APP數(shù)據(jù)列表;/n提取所述APP數(shù)據(jù)列表中各APP的特征參數(shù);/n以所述特征參數(shù)為向量因子,生成特征向量矩陣;/n獲取各預(yù)設(shè)APP向量矩陣集合的中心向量矩陣,確定所述特征向量矩陣與各所述中心向量矩陣間的關(guān)系參數(shù);/n根據(jù)各所述關(guān)系參數(shù),從各所述中心向量矩陣中確定目標(biāo)向量矩陣;/n以所述目標(biāo)向量矩陣所在的APP向量矩陣集合為目標(biāo)集合,獲取所述目標(biāo)集合對(duì)應(yīng)的標(biāo)簽信息,根據(jù)所述標(biāo)簽信息,生成所述目標(biāo)用戶的用戶畫像。/n
【技術(shù)特征摘要】
1.一種用戶畫像生成方法,所述方法包括:
獲取目標(biāo)用戶的APP數(shù)據(jù)列表;
提取所述APP數(shù)據(jù)列表中各APP的特征參數(shù);
以所述特征參數(shù)為向量因子,生成特征向量矩陣;
獲取各預(yù)設(shè)APP向量矩陣集合的中心向量矩陣,確定所述特征向量矩陣與各所述中心向量矩陣間的關(guān)系參數(shù);
根據(jù)各所述關(guān)系參數(shù),從各所述中心向量矩陣中確定目標(biāo)向量矩陣;
以所述目標(biāo)向量矩陣所在的APP向量矩陣集合為目標(biāo)集合,獲取所述目標(biāo)集合對(duì)應(yīng)的標(biāo)簽信息,根據(jù)所述標(biāo)簽信息,生成所述目標(biāo)用戶的用戶畫像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取各預(yù)設(shè)APP向量矩陣集合中的中心向量矩陣包括:
獲取各樣本用戶的樣本APP數(shù)據(jù)列表,根據(jù)所述樣本APP數(shù)據(jù)列表中各APP的特征參數(shù),生成樣本向量矩陣;
對(duì)各所述樣本向量矩陣進(jìn)行聚類分析,獲得多個(gè)所述預(yù)設(shè)APP向量矩陣集合;
確定所述預(yù)設(shè)APP向量矩陣集合的中心向量矩陣。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)各所述樣本向量矩陣進(jìn)行聚類分析,獲得多個(gè)所述預(yù)設(shè)APP向量矩陣集合包括:
根據(jù)K-means聚類分析模型,對(duì)各所述樣本向量矩陣進(jìn)行聚類分析,獲得多個(gè)所述預(yù)設(shè)APP向量矩陣集合。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)K-means聚類分析模型,對(duì)各所述樣本向量矩陣進(jìn)行聚類分析,獲得多個(gè)所述預(yù)設(shè)APP向量矩陣集合包括:
將所述樣本向量矩陣輸入K-means聚類分析模型;
根據(jù)預(yù)設(shè)的聚類集合數(shù)量,確定所述K-means聚類分析模型的聚類K值,任意選取K個(gè)所述樣本向量矩陣,作為初始中心向量矩陣;
計(jì)算所述樣本向量矩陣到各所述初始中心向量矩陣的距離,標(biāo)記與所述樣本向量矩陣距離最短的初始中心向量矩陣,并將所述樣本向量矩陣歸類至標(biāo)記的所述初始中心向量矩陣對(duì)應(yīng)的數(shù)據(jù)集合;
當(dāng)檢測(cè)到所有樣本向量矩陣歸類完成時(shí),計(jì)算各所述數(shù)據(jù)集合的當(dāng)前中心向量矩陣;
當(dāng)所述數(shù)據(jù)集合的初始中心向量矩陣與所述當(dāng)前中心向量矩陣相同時(shí),輸出以所述當(dāng)前中心向量矩陣為聚類中心的聚類結(jié)果,所述聚類結(jié)果包括所述預(yù)設(shè)APP向量矩陣集合。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述當(dāng)檢測(cè)到所有樣本向量矩陣歸類完成時(shí),計(jì)算各所述數(shù)據(jù)集合的當(dāng)前中心向量矩陣之后,還包括:
當(dāng)所述數(shù)據(jù)集合的初始中心...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:郭凌峰,
申請(qǐng)(專利權(quán))人:深圳壹賬通智能科技有限公司,
類型:發(fā)明
國(guó)別省市:廣東;44
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。