本發明專利技術公開了一種基于評分特征的時序推薦方法及推薦裝置,其中,包括以下步驟:采集所有評分數據,并獲取時間信息;將所有評分數據切分成時間段相等的多個時間域,以得到每個時間域上的訓練數據;通過跨域時序協同過濾算法獲取每個時間域上的用戶興趣、物品流行度與公共特征;通過距離公式獲取相鄰時間域之間用戶興趣與物品流行度的共同變化值;如果共同變化值小于或等于預設值,則將當前時間域對商品的評分擴充到相鄰時間域;對每個時間域上的訓練數據進行預測,以進行推薦。本發明專利技術實施例的推薦方法,通過對每個時間域中的訓練數據進行擴充,從而解決時序推薦中的稀疏性問題,提高推薦質量,提高用戶的使用體驗。
【技術實現步驟摘要】
本專利技術涉及機器學習
,特別涉及一種基于評分特征的時序推薦方法及推 薦裝置。
技術介紹
隨著推薦技術的發展,人們發現了用戶的興趣和物品的流行度隨著時間會產生變 化這一現象。即言,傳統的靜態推薦方法并沒有利用時間信息對歷史評分數據進行處理,所 以不能很好地解決這一現象。因此,針對用戶興趣和物品流行度隨時間動態變化這一現象, 需要提出一種時序推薦方法以能夠有效地解決這一問題。 相關技術中,時序推薦方法包括兩種:時間權重推薦方法和時間切片推薦方法。 其中,TWCF(TimeWeightCollaborativeFiltering,時間權重方法),將時間信息融入 傳統協同過濾推薦算法中,具體是在計算皮爾森相關系數時,將商品相似性項上乘上時間 權重因子,并且在計算時間權重因子時,假定商品被評分離當前時間越遠其對當前推薦活 動影響越小,故可以用指數衰減公式計算。時間切片推薦方法是由BinLi等人提出的 CDCF-〇T(Cross_DomainCollaborativeFilteringoverTime,跨域時序協同過濾算法)。 在CDCF-0T技術中,將時間軸進行等時間段切分,通過這種處理,系統收集的所有評分數據 被分到不同的時間段中,每個時間段的評分數據組成一個域,其中假定每個時間域內用戶 興趣和物品流行度是不變的,在域間用戶興趣和物品流行度是變化的。參照圖1所示,針 對這種假設,時間切片推薦方法包括以下步驟:將評分數據集X按時間軸劃為T個時間域, 得到每個時間域上評分數據為X= {X(1),X(2),…,X(T)};挖掘每個時間域中的用戶興趣P= {P⑴,P⑵,…,Pm}和物品流行度Q= {Q⑴,Q⑵,…,Qm},并且得到所有時間域的公共特征 B。其中假定每個時間域中的用戶興趣和物品流行度只受上一個域的影響;對每個時間域的 評分進行預測 然而,相關技術中的時序推薦技術雖然在一定程度上解決了靜態推薦技術中用戶 興趣和物品流行度時序變化這一問題,但仍存在諸多問題。首先,時間權重式的時序推薦方 法人為假定了距離當前時間越遠的評分對當前的推薦影響越小,但是用戶興趣和物品流行 度可能隨時間會有周期性等變化,例如淘寶上涼鞋只在夏天很受歡迎。其次,在時間切片式 的時序推薦方法中,雖然去掉了這一假設,從而可以刻畫出用戶興趣和物品流行度的變化 趨勢,但是該方法為了刻畫這種變化,將所有評分數據切分成若干個時間域,并在每個時間 域上分別刻畫,導致極大地加劇了評分數據的稀疏性,降低了每個時間域上刻畫出來的用 戶興趣和物品流行度的可靠性。在推薦技術中,評分數據的稀疏性極大地制約了推薦的質 量。
技術實現思路
本專利技術旨在至少在一定程度上解決上述相關技術中的技術問題之一。 為此,本專利技術的一個目的在于提出一種基于評分特征的時序推薦方法,該推薦方 法可以提高推薦質量,簡單便捷。 本專利技術的另一個目的在于提出一種基于評分特征的時序推薦裝置。 為達到上述目的,本專利技術一方面實施例提出了一種基于評分特征的時序推薦方 法,包括以下步驟:采集用戶的所有評分數據,并獲取所述所有評分數據的時間信息,其中, 所述時間信息包括起始時間與終止時間;根據所述時間信息將所述所有評分數據切分成時 間段相等的多個時間域,以得到每個時間域上的訓練數據;根據所述每個時間上的訓練數 據通過跨域時序協同過濾算法獲取所述每個時間域上的用戶興趣、物品流行度與所述多個 時間域的公共特征;通過距離公式獲取相鄰時間域之間用戶興趣與物品流行度的共同變化 值;如果對商品偏好的共同變化值小于或等于預設值,則將當前時間域對商品的評分擴充 到相鄰時間域,直至每個相鄰時間域的共同變化值大于所述預設值;以及根據擴充后的每 個時間域的用戶興趣、物品流行度與所述多個時間域的公共特征對所述每個時間域上的訓 練數據進行預測,并根據預測結果進行推薦。 根據本專利技術實施例提出的基于評分特征的時序推薦方法,通過挖掘評分特征的變 化,以對每個時間域上的評分數據進行擴充,增大每個時間域上的評分數據,從而解決時序 推薦中的稀疏性問題,提高推薦質量,提高用戶的使用體驗。 另外,根據本專利技術上述實施例的基于評分特征的時序推薦方法還可以具有如下附 加的技術特征: 優選地,在本專利技術的一個實施例中,所述距離公式可以為KL距離公式。 進一步地,在本專利技術的一個實施例中,通過所述KL距離公式獲取所述相鄰時間域 之間用戶興趣與物品流行度的變化值的公式為: 其中,pu為用戶u興趣,qv為物品v流行度,n為時間域數量。 進一步地,在本專利技術的一個實施例中,根據以下公式得到所述預測結果,所述公式 為: = 其中,t為時間域,B為所述公共特征。 本專利技術另一方面實施例提出了一種基于評分特征的時序推薦裝置,包括:采集模 塊,用于采集用戶的所有評分數據,并獲取所述所有評分數據的時間信息,其中,所述時間 信息包括起始時間與終止時間;切分模塊,用于根據所述時間信息將所述所有評分數據切 分成時間段相等的多個時間域,以得到每個時間域上的訓練數據;獲取模塊,用于根據所述 每個時間上的訓練數據通過跨域時序協同過濾算法獲取所述每個時間域上的用戶興趣、物 品流行度與所述多個時間域的公共特征;計算模塊,用于通過距離公式獲取相鄰時間域之 間用戶興趣與物品流行度的共同變化值;收斂模塊,如果對商品偏好的共同變化值小于或 等于預設值,則將當前時間域對商品的評分擴充到相鄰時間域,直至每個相鄰時間域的共 同變化值大于所述預設值;以及預測模塊,用于根據擴充后的每個時間域的用戶興趣、物品 流行度與所述多個時間域的公共特征對所述每個時間域上的訓練數據進行預測,并根據預 測結果進行推薦。 根據本專利技術實施例提出的基于評分特征的時序推薦裝置,通過挖掘評分特征的變 化,以對每個時間域上的評分數據進行擴充,增大每個時間域上的評分數據,從而解決時序 推薦中的稀疏性問題,提高推薦質量,提高用戶的使用體驗。 另外,根據本專利技術上述實施例的基于評分特征的時序推薦裝置還可以具有如下附 加的技術特征: 優選地,在本專利技術的一個實施例中,所述距離公式可以為KL距離公式。進一步地,在本專利技術的一個實施例中,通過所述KL距離公式獲取所述相鄰時間域 之間用戶興趣與物品流行度的變化值的公式為: 其中,pu為用戶u興趣,qv為物品v流行度,n為時間域數量。進一步地,在本專利技術的一個實施例中,根據以下公式得到所述預測結果,所述公式 為: 其中,t為時間域,B為所述公共特征。本專利技術附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本專利技術的實踐了解到。【附圖說明】本專利技術的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變 得明顯和容易理解,其中: 圖1為相關技術的跨域時序協同過濾算法示意圖; 圖2為根據本專利技術實施例的基于評分特征的時序推薦方法的流程圖;圖3為根據本專利技術一個實施例的基于評分特征的時序推薦方法的流程圖;以及圖4為根據本專利技術實施例的基于評分特征的時序推薦裝置的結構示意圖。【具體實施方式】 下面詳細描述本專利技術的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的本文檔來自技高網...
【技術保護點】
一種基于評分特征的時序推薦方法,其特征在于,包括以下步驟:采集用戶的所有評分數據,并獲取所述所有評分數據的時間信息,其中,所述時間信息包括起始時間與終止時間;根據所述時間信息將所述所有評分數據切分成時間段相等的多個時間域,以得到每個時間域上的訓練數據;根據所述每個時間上的訓練數據通過跨域時序協同過濾算法獲取所述每個時間域上的用戶興趣、物品流行度與所述多個時間域的公共特征;通過距離公式獲取相鄰時間域之間用戶興趣與物品流行度的共同變化值;如果對商品偏好的共同變化值小于或等于預設值,則將當前時間域對商品的評分擴充到相鄰時間域,直至每個相鄰時間域的共同變化值大于所述預設值;以及根據擴充后的每個時間域的用戶興趣、物品流行度與所述多個時間域的公共特征對所述每個時間域上的訓練數據進行預測,并根據預測結果進行推薦。
【技術特征摘要】
【專利技術屬性】
技術研發人員:靳曉明,張子涵,
申請(專利權)人:清華大學,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。