The invention provides a device and a group of false trading, including: transaction identification method of obtaining relevant information of the buyers a preset period of time, the information related to the transaction includes a plurality of commodity ID buyers ID and the buyers; according to the information related to the transaction clustering of buyers, multiple groups of buyers among them, each buyer; group of buyers to buy a variety of the same goods; according to the overall similarity index is calculated for each transaction buyers groups of related information; according to the overall similarity index to identify a plurality of groups of buyers in the false trading group. The application can identify the group false transactions based on the transaction data, and has good self adaptability without prior determination of the training set.
【技術實現(xiàn)步驟摘要】
群體虛假交易識別方法及裝置
本專利技術涉及互聯(lián)網(wǎng)
,特別涉及一種群體虛假交易識別方法及裝置。
技術介紹
在電商平臺上,一些賣家為了獲取更多的流量等平臺資源而進行刷銷量、刷好評等作弊行為,而此種作弊行為逐漸變成一種類似“眾包”的群體作弊行為,即作弊賣家通過即時聊天工具等線上渠道將待作弊商品分發(fā)給全國各地的“刷手”買家,“刷手”買家進行虛假購買并給予好評,提高作弊商品銷量和好評率。現(xiàn)有技術在識別刷單類虛假交易時,事先確定一個訓練集,一般通過買家的顯著異常行為確定訓練集,顯著異常行為例如“發(fā)空包”等行為。此種方法得到的異常數(shù)據(jù)往往是有偏差的,在此類有偏差的訓練集基礎上建模,模型的泛化能力可想而知。除此之外,隨著虛假交易的演變,個體上的虛假交易已經(jīng)“幾可亂真”,越來越難以識別。
技術實現(xiàn)思路
本申請?zhí)峁┮环N群體虛假交易識別方法,包括:獲取預設時間段內(nèi)各買家的交易相關信息,所述交易相關信息包含買家ID及各買家所購買的多個商品的ID;根據(jù)所述交易相關信息對買家進行聚類,得到多個買家群體;其中,每個買家群體中的買家購買了多種相同的商品;根據(jù)所述交易相關信息計算每個買家群體的整體相似度指標;根據(jù)所述整體相似度指標識別出多個所述買家群體中的虛假交易群體。本申請?zhí)峁┮环N群體虛假交易識別裝置,包括:信息獲取單元,用于獲取預設時間段內(nèi)各買家的交易相關信息,所述交易相關信息包含買家ID及各買家所購買的多個商品的ID;聚類單元,用于根據(jù)所述交易相關信息對買家進行聚類,得到多個買家群體;其中,每個買家群體中的買家購買了多種相同的商品計算單元,用于根據(jù)所述交易相關信息計算每個買家群體的 ...
【技術保護點】
一種群體虛假交易識別方法,其特征在于,包括:獲取預設時間段內(nèi)各買家的交易相關信息,所述交易相關信息包含買家ID及各買家所購買的多個商品的ID;根據(jù)所述交易相關信息對買家進行聚類,得到多個買家群體;其中,每個買家群體中的買家購買了多種相同的商品;根據(jù)所述交易相關信息計算每個買家群體的整體相似度指標;根據(jù)所述整體相似度指標識別出多個所述買家群體中的虛假交易群體。
【技術特征摘要】
1.一種群體虛假交易識別方法,其特征在于,包括:獲取預設時間段內(nèi)各買家的交易相關信息,所述交易相關信息包含買家ID及各買家所購買的多個商品的ID;根據(jù)所述交易相關信息對買家進行聚類,得到多個買家群體;其中,每個買家群體中的買家購買了多種相同的商品;根據(jù)所述交易相關信息計算每個買家群體的整體相似度指標;根據(jù)所述整體相似度指標識別出多個所述買家群體中的虛假交易群體。2.根據(jù)權利要求1所述的群體虛假交易識別方法,其特征在于,根據(jù)所述交易相關信息對買家進行聚類,得到多個買家群體,包括:根據(jù)所述交易相關信息計算兩兩買家之間的相似性;根據(jù)所述相似性對買家進行聚類,得到多個買家群體。3.根據(jù)權利要求2所述的群體虛假交易識別方法,其特征在于,根據(jù)所述交易相關信息計算兩兩買家之間的相似性,包括:根據(jù)兩兩買家的交易相關信息計算兩兩買家購買的商品的種類總和及兩兩買家購買的相同商品的種類之和;根據(jù)所述商品的種類總和及相同商品的種類之和計算兩兩買家之間的相似性。4.根據(jù)權利要求3所述的群體虛假交易識別方法,其特征在于,根據(jù)所述商品的種類總和及相同商品的種類之和計算兩兩買家之間的相似性,包括:計算所述相同商品的種類之和與商品的種類總和的比值,該比值表征兩兩買家之間的相似性。5.根據(jù)權利要求3所述的群體虛假交易識別方法,其特征在于,根據(jù)所述相似性對買家進行聚類,得到多個買家群體,包括:比較所述相似性與一相似性臨界值,將相似性大于所述相似性臨界值的買家進行聚類。6.根據(jù)權利要求1所述的群體虛假交易識別方法,其特征在于,所述整體相似度指標包括:買家群體中的買家購買相同商品的種類數(shù)量;根據(jù)所述交易相關信息計算每個買家群體的整體相似度指標,包括:計算每個買家群體中的買家購買相同商品的種類數(shù)量。7.根據(jù)權利要求6所述的群體虛假交易識別方法,其特征在于,根據(jù)所述整體相似度指標識別出多個所述買家群體中的虛假交易群體,包括:將各買家群體的整體相似度指標分別與一預設的相似度指標進行比較,根據(jù)比較結果識別出多個所述買家群體中的虛假交易群體。8.根據(jù)權利要求6所述的群體虛假交易識別方法,其特征在于,根據(jù)所述整體相似度指標識別出多個所述買家群體中的虛假交易群體,包括:根據(jù)每個買家聚類簇的整體相似度指標在所有買家群體的整體相似度指標...
【專利技術屬性】
技術研發(fā)人員:王震,王華君,
申請(專利權)人:阿里巴巴集團控股有限公司,
類型:發(fā)明
國別省市:開曼群島,KY
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。