本申請公開了一種基于多信息源圖嵌入的好友推薦方法及系統,其中,基于多信息源圖嵌入的好友推薦方法包括:獲取源節點信息和目標節點信息;分別對源節點信息和目標節點信息進行圖嵌入處理,并獲取源節點信息的嵌入后結構向量和嵌入后屬性向量,以及目標節點信息的嵌入后結構向量和嵌入后屬性向量;拼接源節點信息的嵌入后的結構向量和嵌入后的屬性向量獲得完整的源節點向量;拼接目標節點信息的嵌入后的結構向量和嵌入后的屬性向量獲得完整的目標節點向量;將完整的源節點向量和完整的目標節點向量進行拼接后送入隱藏層進行學習;完成學習后,輸出節點之間存在的連接的概率并根據概率的大小進行推送。本申請具有提高好友推薦準確度的技術效果。
A Friend Recommendation Method and System Based on Multi-Information Source Graph Embedding
【技術實現步驟摘要】
一種基于多信息源圖嵌入的好友推薦方法及系統
本申請涉及信息
,尤其涉及一種基于多信息源圖嵌入的好友推薦方法及系統。
技術介紹
社交網絡是社會中每個成員之間溝通交流產生關系從而形成的網絡,我們熟悉了解的社交網絡有微信、新浪微博、知乎等等,在這些社交網絡平臺上用戶可以發表自己的一些新奇想法,也可以給他人的想法點贊或者評論從而產生互動,并通過這些互動可以結交到新朋友。社交網絡中一個節點表示一位用戶,節點通過關系連接起來從而形成一個規模巨大的網絡。傳統的,通過鏈接預測觀察到的邊以及節點的屬性來預測兩個節點間存在一條邊的可能性,若兩個節點間存在一條邊就表示兩個用戶存在好友關系,兩個節點之間不存在邊則表示不存在好友關系或者關系未知。為了得到兩個用戶之間確切的關系,在有關社交網絡的鏈接預測研究中,如何準確的表示網絡信息是一個重要問題。傳統的網絡表示一般使用高維的稀疏向量,但高維的稀疏向量需要花費更多的運行時間和計算空間,是人們使用統計學習方法時的局限所在。此外,節點還包含豐富的屬性信息,比如用戶的性別、年齡、學校、星座、位置信息等等。在社交網絡的互動中,年齡比較相近的用戶更可能成為好友,在同一所學校的兩個用戶也比不在一個學校更容易成為好友。另外,用戶的興趣愛好也是好友推薦的一個重要因素。當前的一些社交網站雖然也專門設置了好友推薦模塊,但該好友推薦模塊通常采用協同過濾,即通過用戶-用戶關系矩陣分析用戶之間的相似度,根據相似度大小為用戶推薦新的朋友。但在實際生活中,用戶-用戶交互矩陣中含有大量的缺失值,而且當新用戶加入社交網絡時無法得到交互信息,容易造成數據稀疏、新用戶冷啟動等問題。傳統的好友推薦模塊多只是利用數據信息的結構信息計算兩個用戶的相似性,而將節點中存在的豐富的屬性信息忽略了。如何將這些結構信息和屬性信息充分利用起來,分析出用戶的偏好,了解到用戶更喜歡和哪種類型的人交往,更喜歡購買什么樣的物品,增加推薦結果的準確性和提高用戶的滿意度也是當前需要解決的問題。
技術實現思路
本申請的目的在于提供一種基于多信息源圖嵌入的好友推薦方法及系統,具有利用屬性信息和圖嵌入算法提高了好友推薦的準確度的技術效果。為達到上述目的,本申請提供一種基于多信息源圖嵌入的好友推薦方法,包括如下步驟:獲取源節點信息和目標節點信息;分別對源節點信息和目標節點信息進行圖嵌入處理,并獲取源節點信息的嵌入后結構向量和嵌入后屬性向量,以及目標節點信息的嵌入后結構向量和嵌入后屬性向量;拼接源節點信息的嵌入后的結構向量和嵌入后的屬性向量獲得完整的源節點向量;拼接目標節點信息的嵌入后的結構向量和嵌入后的屬性向量獲得完整的目標節點向量;將完整的源節點向量和完整的目標節點向量進行拼接后,送入隱藏層進行學習;完成學習后,輸出節點之間存在的連接的概率,并根據概率的大小進行推送。優選的,源節點信息包括源節點結構信息和源節點屬性信息;目標節點信息包括目標節點結構信息和目標節點屬性信息。優選的,源節點結構信息采用獨熱編碼的形式轉換為一組二進制的結構輸入向量輸入。優選的,源節點屬性信息為離散屬性或連續屬性;離散屬性采用獨熱編碼的形式轉換為一組二進制的屬性輸入向量輸入,連續屬性通過詞頻-逆向文件頻率轉換為實值向量輸入。優選的,源節點信息的獨熱編碼輸入的結構輸入向量通過節點嵌入算法嵌入為源節點信息的嵌入后結構向量源節點的屬性輸入向量或實值向量通過自定義的權重矩陣W(k)嵌入為源節點信息的嵌入后屬性向量優選的,將源節點信息的嵌入后的結構向量和嵌入后的屬性向量送入拼接層進行拼接,并獲取完整的源節點向量us,該完整的源節點向量us表達式如下:式中,α為權重,用于調整結構信息與屬性信息之間的平衡。優選的,α的取值范圍為[0,1]。一種基于多信息源圖嵌入的好友推薦系統,包括服務器和與服務器連接的至少一個客戶端;其中,服務器:用于執行上述的基于多信息源圖嵌入的好友推薦方法;服務器內具有推薦模型;客戶端:用于接收服務器的推送信息。優選的,推薦模型包括依次設置的輸入層、嵌入層、拼接層、隱藏層和輸出層;輸入層:用于獲取源節點信息和目標節點信息;嵌入層:用于對源節點信息和目標節點信息進行圖嵌入處理,獲取源節點信息的結構低維緊密向量和屬性低維緊密向量;以及獲取目標節點信息的結構低維緊密向量和屬性低維緊密向量;拼接層:用于拼接源節點信息的結構低維緊密向量和屬性低維緊密向量獲得完整的源節點向量;用于拼接目標節點信息的結構低維緊密向量和屬性低維緊密向量獲得完整的目標節點向量;隱藏層:用于將完整的源節點向量和完整的目標節點向量拼接起來,并對拼接后的向量進行分析和訓練;輸出層:用于根據分析和訓練,輸出概率值,并根據概率值進行好友推送。優選的,隱藏層具有多個子隱藏層。本申請實現的有益效果如下:(1)本申請的基于多信息源圖嵌入的好友推薦方法及系統將深度學習應用到社交網絡的好友推薦中,利用結構信息和屬性信息兩種信息,通過圖嵌入的方法對兩部分信息進行處理,并且在早期進行融合,利用深度神經網絡學習用戶的節點表示,得到成為好友的可能性,并根據該可能性為用戶推薦好友,大大提高了好友推薦的準確度。(2)本申請的基于多信息源圖嵌入的好友推薦方法及系統通過圖嵌入將圖轉換為保存圖信息的低維空間,利用一個映射函數將網絡圖中每個節點轉換成低維度的潛在表示。(3)本申請的基于多信息源圖嵌入的好友推薦方法及系統將結構信息和屬性信息同時作為推送模型的輸入,其中結構信息捕獲節點在網絡中的結構相似性,屬性信息捕獲屬性同質性,兩部分信息互補充分挖掘節點之間的關系;另外,利用節點之間的權重表示節點之間的關系,權重越大表示關系越密切,反之,權重下表示關系疏遠。(4)本申請的基于多信息源圖嵌入的好友推薦方法及系統對于結構信息和屬性信息采取不同的處理方式,處理后的結構向量和屬性向量進行早期的融合學習,采用不同的融合方式融合兩部分信息,通過權重α調節兩部分信息的比例,最后將整合的節點表示送到推送模型中進行學習,預測兩個節點之間的關系。附圖說明為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對于本領域普通技術人員來講,還可以根據這些附圖獲得其他的附圖。圖1為推送模型一種實施例的結構示意圖;圖2為在UNC數據集上的子隱層數層數對AUC值的影響的折線圖;圖3為基于多信息源圖嵌入的好友推薦系統一種實施例的流程圖;圖4為CommonNeighbors、Adamic-Adar、Deepwalk和node2vec四種算法在OKLAHOMA數據集上的表現柱狀圖;圖5為CommonNeighbors、Adamic-Adar、Deepwalk和node2vec四種算法在UNC數據集上的表現柱狀圖;圖6為CommonNeighbors、Adamic-Adar、Deepwalk和node2vec四種算法在Citeseer數據集的表現柱狀圖;圖7為不同權重α在數據集上的比較折線圖。具體實施方式下面結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本專利技術一部分實施例,而不是全部的實施例。基于本專利技術本文檔來自技高網...
【技術保護點】
1.一種基于多信息源圖嵌入的好友推薦方法,其特征在于,步驟如下:獲取源節點信息和目標節點信息;分別對所述源節點信息和所述目標節點信息進行圖嵌入處理,并獲取所述源節點信息的嵌入后結構向量和嵌入后屬性向量,以及所述目標節點信息的嵌入后結構向量和嵌入后屬性向量;拼接所述源節點信息的嵌入后的結構向量和嵌入后的屬性向量獲得完整的源節點向量;拼接所述目標節點信息的嵌入后的結構向量和嵌入后的屬性向量獲得完整的目標節點向量;將完整的源節點向量和完整的目標節點向量進行拼接后,送入隱藏層進行學習;完成學習后,輸出節點之間存在的連接的概率,并根據所述概率的大小進行推送。
【技術特征摘要】
1.一種基于多信息源圖嵌入的好友推薦方法,其特征在于,步驟如下:獲取源節點信息和目標節點信息;分別對所述源節點信息和所述目標節點信息進行圖嵌入處理,并獲取所述源節點信息的嵌入后結構向量和嵌入后屬性向量,以及所述目標節點信息的嵌入后結構向量和嵌入后屬性向量;拼接所述源節點信息的嵌入后的結構向量和嵌入后的屬性向量獲得完整的源節點向量;拼接所述目標節點信息的嵌入后的結構向量和嵌入后的屬性向量獲得完整的目標節點向量;將完整的源節點向量和完整的目標節點向量進行拼接后,送入隱藏層進行學習;完成學習后,輸出節點之間存在的連接的概率,并根據所述概率的大小進行推送。2.根據權利要求1所述的基于多信息源圖嵌入的好友推薦方法,其特征在于,所述源節點信息包括源節點結構信息和源節點屬性信息;所述目標節點信息包括目標節點結構信息和目標節點屬性信息。3.根據權利要求2所述的基于多信息源圖嵌入的好友推薦方法,其特征在于,所述源節點結構信息采用獨熱編碼的形式轉換為一組二進制的結構輸入向量輸入。4.根據權利要求3所述的基于多信息源圖嵌入的好友推薦方法,其特征在于,所述源節點屬性信息為離散屬性或連續屬性;所述離散屬性采用獨熱編碼的形式轉換為一組二進制的屬性輸入向量輸入,所述連續屬性通過詞頻-逆向文件頻率轉換為實值向量輸入。5.根據權利要求4所述的基于多信息源圖嵌入的好友推薦方法,其特征在于,源節點信息的獨熱編碼輸入的結構輸入向量通過節點嵌入算法嵌入為源節點信息的嵌入后結構向量源節點的屬性輸入向量或實值向量通過自定義的權重矩陣W(k)嵌入為源節點信息的嵌入后屬性向量6.根據權利要求5所述的基...
【專利技術屬性】
技術研發人員:張邦佐,李瑞雪,孫小新,馮國忠,
申請(專利權)人:東北師范大學,
類型:發明
國別省市:吉林,22
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。