The invention discloses a method and a device for identifying labels, which belongs to the technical field of computer. The method comprises: acquiring the target application target keywords corresponding to the set target keywords set includes a first type of keywords; keywords reference to obtain reference corresponding to the application set, reference set of keywords includes a first type of keywords and / or second key words; according to the target set of keywords and keyword reference set the target application corresponding labels according to a predetermined algorithm, and / or, according to the target set of keywords and reference set of keywords in accordance with the theme analysis model to determine the target application corresponding to the label; due to target application corresponding to the label and not by the promotion personnel and / or developers according to subjective judgment determined by the server, but each keyword according to the collected in accordance with the objective set analysis of predetermined algorithms and / or theme analysis model, therefore, determine Get more accurate labels.
【技術實現步驟摘要】
本公開涉及計算機
,特別涉及一種標簽確定方法及裝置。
技術介紹
隨著智能終端的發展和普及,智能終端中的應用程序也越來越多,為了方便對應用程序的查詢和推廣,通常會為應用程序添加描述性的詞語作為該應用程序的標簽以反映該應用程序所屬的類別。目前通常是由開發人員在開發時為應用程序添加標簽,或者,由推廣人員在推廣時為應用程序添加標簽,開發人員和/或推廣人員通常是通過主觀判斷確定并添加應用程序的標簽的,人為添加的標簽通常不夠準確。
技術實現思路
為了解決由推廣人員和/或開發人員人工地為應用程序添加的標簽不夠準確的問題,本公開提供一種標簽確定方法及裝置。所述技術方案如下:第一方面,提供一種標簽確定方法,該方法包括:獲取目標應用程序對應的目標關鍵詞集合,目標關鍵詞集合中包括第一類關鍵詞;獲取參考應用程序對應的參考關鍵詞集合,參考關鍵詞集合中包括第一類關鍵詞和/或第二類關鍵詞;根據目標關鍵詞集合和參考關鍵詞集合按照預定算法確定目標應用程序對應的標簽,和/或,根據目標關鍵詞集合和參考關鍵詞集合按照主題分析模型確定目標應用程序對應的標簽;其中,第一類關鍵詞是直接與目標應用程序存在對應關系的關鍵詞,第二類關鍵詞是通過至少一個關聯元素與目標應用程序存在對應關系的關鍵詞。可選的,至少一個關聯元素至少包括參考應用程序,以及目標關鍵詞集合中與參考應用程序存在對應關系的第一類關鍵詞;根據目標關鍵詞集合和參考關鍵詞集合按照預定算法確定目標應用程序對應的標簽,包括:對于目標關鍵詞集合和參考關鍵詞集合中的每個第一類關鍵詞,獲取第一類關鍵詞與目標應用程序之間的相似度;對于參考關鍵詞集合中的每個 ...
【技術保護點】
一種標簽確定方法,其特征在于,所述方法包括:獲取目標應用程序對應的目標關鍵詞集合,所述目標關鍵詞集合中包括第一類關鍵詞;獲取參考應用程序對應的參考關鍵詞集合,所述參考關鍵詞集合中包括所述第一類關鍵詞和/或第二類關鍵詞;根據所述目標關鍵詞集合和所述參考關鍵詞集合按照預定算法確定所述目標應用程序對應的標簽,和/或,根據所述目標關鍵詞集合和所述參考關鍵詞集合按照主題分析模型確定所述目標應用程序對應的所述標簽;其中,所述第一類關鍵詞是直接與所述目標應用程序存在對應關系的關鍵詞,所述第二類關鍵詞是通過至少一個關聯元素與所述目標應用程序存在對應關系的關鍵詞。
【技術特征摘要】
1.一種標簽確定方法,其特征在于,所述方法包括:獲取目標應用程序對應的目標關鍵詞集合,所述目標關鍵詞集合中包括第一類關鍵詞;獲取參考應用程序對應的參考關鍵詞集合,所述參考關鍵詞集合中包括所述第一類關鍵詞和/或第二類關鍵詞;根據所述目標關鍵詞集合和所述參考關鍵詞集合按照預定算法確定所述目標應用程序對應的標簽,和/或,根據所述目標關鍵詞集合和所述參考關鍵詞集合按照主題分析模型確定所述目標應用程序對應的所述標簽;其中,所述第一類關鍵詞是直接與所述目標應用程序存在對應關系的關鍵詞,所述第二類關鍵詞是通過至少一個關聯元素與所述目標應用程序存在對應關系的關鍵詞。2.根據權利要求1所述的方法,其特征在于,所述至少一個關聯元素至少包括所述參考應用程序,以及所述目標關鍵詞集合中與所述參考應用程序存在對應關系的第一類關鍵詞;所述根據所述目標關鍵詞集合和所述參考關鍵詞集合按照預定算法確定所述目標應用程序對應的標簽,包括:對于所述目標關鍵詞集合和所述參考關鍵詞集合中的每個所述第一類關鍵詞,獲取所述第一類關鍵詞與所述目標應用程序之間的相似度;對于所述參考關鍵詞集合中的每個所述第二類關鍵詞,按照所述預定算法根據所述目標關鍵詞集合和所述第二類關鍵詞對應的應用程序集合之間的相似度計算所述第二類關鍵詞與所述目標應用程序之間的相似度,所述應用程序集合是直接與所述第二類關鍵詞存在對應關系的各個應用程序的集合;確定所述目標關鍵詞集合和所述參考關鍵詞集合中與所述目標應用程序之間的相似度大于預設相似度的關鍵詞為所述目標應用程序對應的所述標簽。3.根據權利要求2所述的方法,其特征在于,所述按照所述預定算法根據所述目標關鍵詞集合和所述第二類關鍵詞對應的應用程序集合之間的相似度計算所述第二類關鍵詞與所述目標應用程序之間的相似度,包括計算:s(a,b)=1,a=bc|I(a)||I(b)|Σi|I(a)|Σj|I(b)|s(Ii(a),Ij(b)),a≠b,I(a)≠φ,I(b)≠φ0,otherwise]]>其中,s(x,y)表示x與y之間的相似度,a表示所述目標應用程序,b表示所述第二類關鍵詞,I(a)是所述目標關鍵詞集合,I(b)是所述第二類關鍵詞對應的所述應用程序集合,c是預設衰減因子。4.根據權利要求1所述的方法,其特征在于,所述至少一個關聯元素包括所述目標關鍵詞集合中與所述第二類關鍵詞屬于同一個主題的第一類關鍵詞;所述根據所述目標關鍵詞集合和所述參考關鍵詞集合按照主題分析模型確定所述目標應用程序對應的所述標簽,包括:根據所述主題分析模型確定所述目標關鍵詞集合中包括的所述第一類關鍵詞對應的各個主題;確定在所述目標關鍵詞集合中所占的比例達到第一比例閾值的目標主題;確定所述目標關鍵詞集合和所述參考關鍵詞集合中,屬于所述目標主題且在所述目標主題中所占的比例達到第二比例閾值的關鍵詞為所述目標應用程序對應的所述標簽。5.根據權利要求1至4任一所述的方法,其特征在于,所述獲取目標應用程序對應的目標關鍵詞集合,包括:獲取歷史搜索所述目標應用程序的搜索請求中包括的所述第一類關鍵詞;和/或,通過網絡爬蟲獲取所述目標應用程序對應的所述第一類關鍵詞;和/或,獲取所述目標應用程序的描述信息中包括的所述第一類關鍵詞。6.一種標簽確定裝置,其特征在于,所述裝置包括:第一獲取模塊,被配置為獲取目標應用程序對應的目標關鍵詞集合,所述目標關鍵詞集合中包括第一類關鍵詞;第二獲取模塊,被配置為獲取參考應用程序對應的參考關鍵詞集合,所述參考關鍵詞集合中包括所述第一類關鍵詞和/或第二類關鍵詞...
【專利技術屬性】
技術研發人員:陸子龍,張衛,吳宏剛,閆銘,
申請(專利權)人:北京小米移動軟件有限公司,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。