System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請屬于計算機,尤其涉及一種用戶虛擬身份映射方法、裝置、終端設備及介質。
技術介紹
1、越來越多的用戶開始習慣在社交網絡上實現日常的互動和信息的獲取,在其過程中會留下賬號的節點屬性(如年齡、性別、工作單位等)和節點間好友關系(關注、轉發、評論等)。對這些信息進行整合、分析,將構成用戶虛擬身份完整的個人畫像,對商業上的信息服務推送、好友推薦以及網絡安全治理等領域有重要意義。但是現有的社交網絡與社交網絡之間由于功能不同,因此往往是相互獨立的,普通用戶擁有多個不同社交網站的賬號是較普遍的情況,而且針對同一用戶在不同網絡上的注冊信息缺乏有效的管理平臺進行統一管理。同時由于隱私保護等方面的考慮,只有少數用戶會在多個平臺公開可直接用于匹配的,具有唯一性的身份信息。
2、因此,為了分析某用戶甚至群體用戶在社交網絡上的行為,獲取用戶的完整畫像,需要整合用戶在不同社交網絡上的數據,如何在缺少豐富先驗的賬號匹配知識的情況下,有效地識別用戶在多個社交網絡上的賬號,進行跨社交平臺的用戶虛擬身份映射,是目前急需解決的問題。
技術實現思路
1、本申請意在提供一種用戶虛擬身份映射方法、裝置、終端設備及介質,以解決現有技術中存在的不足,本申請要解決的技術問題通過以下技術方案來實現。
2、第一個方面,本申請實施例提供一種用戶虛擬身份映射方法,所述方法包括:
3、獲取第一社交網絡的用戶數據,其中,所述用戶數據至少包括用戶虛擬身份屬性數據和關系數據;
4、根據所述用戶數
5、在所述匹配度大于閾值的情況下,將所述相鄰節點的匹配對象對應的第二社交網絡,確定為與所述用戶數據對應的目標社交網絡。
6、可選地,所述識別模型通過如下方式獲得:
7、獲取社交網絡的樣本數據,其中,所述社交網絡的樣本數據來自不同的社交平臺;所述社交網絡的樣本數據至少包括用戶虛擬身份屬性數據和關系數據;
8、對所述社交網絡的樣本數據進行預處理,得到正樣本數據,并根據所述正樣本數據,確定與所述正樣本數據對應負樣本數據,將所述正樣本數據和所述負樣本數據,確定為訓練樣本集;
9、根據所述訓練樣本集,對圖神經網絡模型進行訓練,得到模型輸出結果;
10、根據所述模型輸出結果,確定與所述模型輸出結果對應的損失函數;
11、在所述損失函數的函數值滿足預設值的情況下,將與所述損失函數對應的圖神經網絡模型確定為所述識別模型。
12、可選地,所述方法還包括:
13、根據所述正樣本數據,確定所述正樣本數據在不同社交關系網絡中的相鄰節點;
14、計算所述相鄰節點的匹配對象的匹配度;
15、在所述匹配度大于閾值的情況下,將所述相鄰節點確定為所述正樣本數據。
16、可選地,所述對所述社交網絡的樣本數據進行預處理,得到正樣本數據,并根據所述正樣本數據,確定與所述正樣本數據對應負樣本數據,將所述正樣本數據和所述負樣本數據,確定為訓練樣本集,包括:
17、根據所述樣本數據中的用戶虛擬身份屬性數據和關系數據,生成與用戶對應的不同社交網絡的網絡圖結構;
18、獲取所述網絡圖結構中的用戶節點的初始特征向量,所述用戶節點的初始特征向量至少包括用戶名長度、特殊字符、數字占比、字符輸入模式和字符組合模式。
19、可選地,所述根據所述訓練樣本集,對圖神經網絡模型進行訓練,得到模型輸出結果,包括:
20、基于不同社交網絡的網絡圖結構中的用戶節點的初始特征向量,以及各個節點之間的關聯關系,通過所述圖神經網絡模型,對不同的網絡圖結構進行節點融合,得到融合結果。
21、可選地,所述通過所述圖神經網絡模型,對不同的網絡圖結構進行節點融合,得到融合結果,包括:
22、將第一社交網絡中的預設節點的第一嵌入向量,輸入第一圖神經網絡模型中,得到第一輸出結果;
23、將第二社交網絡中的預設節點的第二嵌入向量,輸入第二圖神經網絡模型中,得到第二輸出結果;
24、將所述第一輸出結果和所述第二輸出結果進行拼接,得到拼接向量;
25、將所述拼接向量到解碼器中,得到判別向量,其中,所述解碼器至少包括兩層全連接網絡和一層激活函數;
26、根據所述判別向量,確定用戶在不同社交網絡中的匹配度。
27、第二個方面,本申請實施例提供一種用戶虛擬身份映射裝置,所述裝置包括:
28、獲取模塊,用于獲取第一社交網絡的用戶數據,其中,所述用戶數據至少包括用戶虛擬身份屬性數據和關系數據;
29、識別模塊,用于根據所述用戶數據和預先訓練好的識別模型,確定與所述第一社交網絡的用戶數據對應的相鄰節點的匹配對象的匹配度;其中,所述預先訓練好的識別模型是采用社交網絡的樣本數據對圖神經網絡模型進行訓練得到的;
30、匹配模塊,用于在所述匹配度大于閾值的情況下,將所述相鄰節點的匹配對象對應的第二社交網絡,確定為與所述用戶數據對應的目標社交網絡。
31、可選地,所述裝置還包括訓練模塊,所述訓練模塊用于:
32、獲取社交網絡的樣本數據,其中,所述社交網絡的樣本數據來自不同的社交平臺;所述社交網絡的樣本數據至少包括用戶虛擬身份屬性數據和關系數據;
33、對所述社交網絡的樣本數據進行預處理,得到正樣本數據,并根據所述正樣本數據,確定與所述正樣本數據對應負樣本數據,將所述正樣本數據和所述負樣本數據,確定為訓練樣本集;
34、根據所述訓練樣本集,對圖神經網絡模型進行訓練,得到模型輸出結果;
35、根據所述模型輸出結果,確定與所述模型輸出結果對應的損失函數;
36、在所述損失函數的函數值滿足預設值的情況下,將與所述損失函數對應的圖神經網絡模型確定為所述識別模型。
37、可選地,所述訓練模塊用于:
38、根據所述正樣本數據,確定所述正樣本數據在不同社交關系網絡中的相鄰節點;
39、計算所述相鄰節點的匹配對象的匹配度;
40、在所述匹配度大于閾值的情況下,將所述相鄰節點確定為所述正樣本數據。
41、可選地,所述訓練模塊用于:
42、根據所述樣本數據中的用戶虛擬身份屬性數據和關系數據,生成與用戶對應的不同社交網絡的網絡圖結構;
43、獲取所述網絡圖結構中的用戶節點的初始特征向量,所述用戶節點的初始特征向量至少包括用戶名長度、特殊字符、數字占比、字符輸入模式和字符組合模式。
44、可選地,所述訓練模塊用于:
45、基于不同社交網絡的網絡圖結構中的用戶節點的初始特征向量,以及各個節點之間的關聯關系,通過所述圖本文檔來自技高網...
【技術保護點】
1.一種用戶虛擬身份映射方法,其特征在于,所述方法包括:
2.根據權利要求1所述的用戶虛擬身份映射方法,其特征在于,所述識別模型通過如下方式獲得:
3.根據權利要求2所述的用戶虛擬身份映射方法,其特征在于,所述方法還包括:
4.根據權利要求2所述的用戶虛擬身份映射方法,其特征在于,所述對所述社交網絡的樣本數據進行預處理,得到正樣本數據,并根據所述正樣本數據,確定與所述正樣本數據對應負樣本數據,將所述正樣本數據和所述負樣本數據,確定為訓練樣本集,包括:
5.根據權利要求4所述的用戶虛擬身份映射方法,其特征在于,所述根據所述訓練樣本集,對圖神經網絡模型進行訓練,得到模型輸出結果,包括:
6.根據權利要求5所述的用戶虛擬身份映射方法,其特征在于,所述通過所述圖神經網絡模型,對不同的網絡圖結構進行節點融合,得到融合結果,包括:
7.一種用戶虛擬身份映射裝置,其特征在于,所述裝置包括:
8.根據權利要求7所述的用戶虛擬身份映射裝置,其特征在于,所述裝置還包括訓練模塊,所述訓練模塊用于:
9.一種
10.一種計算機可讀存儲介質,其特征在于,該計算機可讀存儲介質中存儲有計算機程序,所述計算機程序被執行時實現權利要求1-6中任一項所述的用戶虛擬身份映射方法。
...【技術特征摘要】
1.一種用戶虛擬身份映射方法,其特征在于,所述方法包括:
2.根據權利要求1所述的用戶虛擬身份映射方法,其特征在于,所述識別模型通過如下方式獲得:
3.根據權利要求2所述的用戶虛擬身份映射方法,其特征在于,所述方法還包括:
4.根據權利要求2所述的用戶虛擬身份映射方法,其特征在于,所述對所述社交網絡的樣本數據進行預處理,得到正樣本數據,并根據所述正樣本數據,確定與所述正樣本數據對應負樣本數據,將所述正樣本數據和所述負樣本數據,確定為訓練樣本集,包括:
5.根據權利要求4所述的用戶虛擬身份映射方法,其特征在于,所述根據所述訓練樣本集,對圖神經網絡模型進行訓練...
【專利技術屬性】
技術研發人員:胡月月,趙悅楷,石光,呂青,趙寧,陳蘇,張翀斌,臧天寧,
申請(專利權)人:北京中科創途科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。