The embodiment of the invention discloses a label determining method, equipment and system, the current node device receives the label update message, node device, and the label update message to the label to be determined which carry the label type and label label update messages; when the node equipment before the node equipment update the label to be determined the label of the current node equipment; convergence judgment coefficient residual label label node equipment to be determined in before and after updating the value is less than a preset; when the judgment result is yes, the current node equipment will be updated after the label set to be determined for the label of the node devices to determine the label. Through the application of the technical scheme for the equipment to be determined fast determine the node label node device using a small amount of tags have been identified, so as to improve the efficiency of tag nodes to determine the level of implementation minutes large graph for one billion level of the label to determine.
【技術(shù)實現(xiàn)步驟摘要】
本申請涉及通信
,尤其涉及一種標簽確定方法、設(shè)備和系統(tǒng)。
技術(shù)介紹
現(xiàn)有技術(shù)中,通常會應(yīng)用標簽傳播算法根據(jù)已標記商品、店鋪或視頻等實體的標簽信息去預(yù)測未標記商品、店鋪或視頻等實體的標簽信息,例如,電子購物網(wǎng)站的商品類目分類、O2O(OnlineToOffline,線上線下電子商務(wù))店鋪主營業(yè)務(wù)分類、視頻分享網(wǎng)站的視頻分類等場景中。現(xiàn)有的標簽傳播算法通常是根據(jù)人工標記的已標記實體的標簽,利用半監(jiān)督的方法,根據(jù)實體和實體之間的相似度進行標簽傳播,從而,對未標記的實體進行標記。申請人在實現(xiàn)本專利技術(shù)的過程中發(fā)現(xiàn)現(xiàn)有分類技術(shù)中存在以下技術(shù)問題:(1)人工標記標簽的人力投入成本很高,而且效率比較低,并且容易出現(xiàn)錯誤或遺漏。(2)隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,動輒十億級別,甚至規(guī)模更加巨大的海量數(shù)據(jù)集的標簽傳播確定過程的時間復(fù)雜度非常高,以至于常規(guī)的單機方案無法無法解決海量數(shù)據(jù)集的標簽確定需求。
技術(shù)實現(xiàn)思路
本申請實施例提供了一種標簽確定的方法及設(shè)備,用以利用少量的標簽已確定的節(jié)點設(shè)備確定大量的標簽待確定的節(jié)點設(shè)備。為此,本申請采用以下技術(shù)手段:本申請實施例提供了一種標簽確定的方法,應(yīng)用于包括基于整體同步并行計算模型BSP架構(gòu)的多個節(jié)點設(shè)備的系統(tǒng)中,該方法包括:當(dāng)前節(jié)點設(shè)備接收標簽更新消息,并將所述標簽更新消息發(fā)送給標簽待確定的節(jié)點設(shè)備,其中,所述標簽更新消息中攜帶標簽類型和標簽值;所述當(dāng)前節(jié)點設(shè)備根據(jù)所述標簽類型和標簽值,以及所述標簽待確定的節(jié)點設(shè)備當(dāng)前的標簽,更新所述標簽待確定的節(jié)點設(shè)備的標簽;所述當(dāng)前節(jié)點設(shè)備判斷所述標簽待確定的節(jié)點設(shè)備在更新前和更新后的標簽值的殘差 ...
【技術(shù)保護點】
一種標簽確定的方法,應(yīng)用于包括基于整體同步并行計算模型BSP架構(gòu)的多個節(jié)點設(shè)備的系統(tǒng)中,其特征在于,該方法包括:當(dāng)前節(jié)點設(shè)備接收標簽更新消息,并將所述標簽更新消息發(fā)送給標簽待確定的節(jié)點設(shè)備,其中,所述標簽更新消息中攜帶標簽類型和標簽值;所述當(dāng)前節(jié)點設(shè)備根據(jù)所述標簽類型和標簽值,以及所述標簽待確定的節(jié)點設(shè)備當(dāng)前的標簽,更新所述標簽待確定的節(jié)點設(shè)備的標簽;所述當(dāng)前節(jié)點設(shè)備判斷所述標簽待確定的節(jié)點設(shè)備在更新前和更新后的標簽值的殘差是否小于預(yù)設(shè)的收斂系數(shù);當(dāng)判斷結(jié)果為是時,所述當(dāng)前節(jié)點設(shè)備將所述更新后的標簽設(shè)置為所述標簽待確定的節(jié)點設(shè)備的確定標簽。
【技術(shù)特征摘要】
1.一種標簽確定的方法,應(yīng)用于包括基于整體同步并行計算模型BSP架構(gòu)的多個節(jié)點設(shè)備的系統(tǒng)中,其特征在于,該方法包括:當(dāng)前節(jié)點設(shè)備接收標簽更新消息,并將所述標簽更新消息發(fā)送給標簽待確定的節(jié)點設(shè)備,其中,所述標簽更新消息中攜帶標簽類型和標簽值;所述當(dāng)前節(jié)點設(shè)備根據(jù)所述標簽類型和標簽值,以及所述標簽待確定的節(jié)點設(shè)備當(dāng)前的標簽,更新所述標簽待確定的節(jié)點設(shè)備的標簽;所述當(dāng)前節(jié)點設(shè)備判斷所述標簽待確定的節(jié)點設(shè)備在更新前和更新后的標簽值的殘差是否小于預(yù)設(shè)的收斂系數(shù);當(dāng)判斷結(jié)果為是時,所述當(dāng)前節(jié)點設(shè)備將所述更新后的標簽設(shè)置為所述標簽待確定的節(jié)點設(shè)備的確定標簽。2.如權(quán)利要求1所述的方法,其特征在于,所述當(dāng)前節(jié)點設(shè)備接收標簽更新消息,并將所述標簽更新消息發(fā)送給標簽待確定的節(jié)點設(shè)備,具體包括:所述當(dāng)前節(jié)點設(shè)備接收標簽已確定的節(jié)點設(shè)備發(fā)送的標簽更新消息,其中,所述標簽更新消息中攜帶的標簽類型和標簽值是所述當(dāng)前節(jié)點設(shè)備根據(jù)所述標簽已確定的節(jié)點設(shè)備與所述標簽待確定的節(jié)點設(shè)備的相似度和阻尼系數(shù)得到的。3.如權(quán)利要求1所述的方法,其特征在于,所述當(dāng)前節(jié)點設(shè)備將所述更新后的標簽設(shè)置為所述標簽待確定的節(jié)點設(shè)備的確定標簽后,所述方法還包括:所述當(dāng)前節(jié)點設(shè)備將所述標簽待確定的節(jié)點設(shè)備的狀態(tài)設(shè)置為標簽已確定的節(jié)點設(shè)備,并不再對所述確定標簽進行更新。4.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括:當(dāng)所述當(dāng)前節(jié)點設(shè)備判斷所述標簽待確定的節(jié)點設(shè)備在更新前和更新后的標簽值的殘差不小于預(yù)設(shè)的收斂系數(shù)時,則再次接收標簽更新消息。5.如權(quán)利要求1-4任一項所述的方法,其特征在于,所述方法還包括:如果所述標簽待確定的節(jié)點設(shè)備不存在當(dāng)前的標簽,則設(shè)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:毛仁歆,李龍飛,
申請(專利權(quán))人:阿里巴巴集團控股有限公司,
類型:發(fā)明
國別省市:開曼群島;KY
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。