System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于序列推薦領域,具體涉及一種基于時間間隔數據增強的對比學習序列推薦方法及系統。
技術介紹
1、推薦系統是為企業提供增強用戶互動性、提升銷售量和增強用戶體驗感的有效途徑,例如電子商務平臺、醫療服務、社交行為分析、旅游相關的應用等。序列推薦專注于用戶行為的時間順序,關注用戶行為的時間序列特性,通過捕捉用戶在過去一段時間內的行為模式,來推斷他們未來的偏好,以預測用戶下一步可能感興趣的內容。
2、近年來,引入對比學習的transformer推薦模型已被廣泛用于視頻平臺、購物平臺中,作為自我監督學習的典例,對比學習通過最大化正向樣本之間的一致性以及將負向樣本與正向樣本區分開來,在從無標簽數據中生成高質量嵌入表征表現較強。例如,通過數據擴增從原始序列中構建正樣本,從而進行對比學習。還例如通過無監督剔除和有監督正向采樣來構建正向樣本。這些對比學習的數據增強方法可以增強序列編碼器的分辨能力,并提高魯棒性和抗噪能力。為了解決歷史交互和當前交互的時間間隔可能存在顯著變化所導致的用戶建模穩定性減小的問題,還通過從時間間隔的角度對序列數據進行擴增,考慮整體序列的均勻性,在兩個相鄰的行為之間插入一個新的項目,從而使整個序列更加均勻。然而,用戶行為的局部動態變化可能會對其產生影響,特別是當用戶在短時間內頻繁購買同一類別的商品。
3、綜上,現有的數據增強方法大多集中于用戶個體的行為序列,而忽略了用戶之間的潛在信息共享。用戶之間的相似性或社交關系網絡中蘊含的大量有價值的信息尚未被充分利用。
技術實
1、基于現有技術存在的問題,本申請提出了一種基于時間間隔數據增強的對比學習序列推薦方法及系統,分別從單用戶的用戶行為序列和跨用戶的用戶行為序列設計了最長均勻子序列,從而既能從全局角度又能從局部角度,增強用戶行為序列的代表性,更好的反映用戶的實際行為模式;增強數據的有效性,還能提高模型對用戶偏好的捕捉精度;本專利技術還采用了超越自注意力機制;所述超越自注意力機制采用傅里葉變換平衡歸納偏置與自注意力機制。利用傅立葉變換引入的歸納偏差,使得對比學習序列推薦模型能夠感知頻率信息,從而捕捉到單一自我注意機制可能忽略的基本模式和周期性,增強了對比學習序列推薦模型的歸納能力。
2、在本申請的第一方面,本申請提出了一種基于時間間隔數據增強的對比學習序列推薦方法,所述方法包括:
3、獲取原始序列推薦數據,所述原始序列推薦數據為多個用戶的用戶行為序列;所述用戶行為序列為按照時間先后順序排列的用戶與項目的交互項;
4、將每個用戶行為序列分別劃分為多個子序列,按照每個子序列的時間標準差和序列長度確定出最長均勻子序列;
5、在每個用戶行為序列中替換插入最長均勻子序列,得到增強后的序列推薦數據;
6、在不同用戶行為序列中替換最長均勻子序列,得到增強后的序列推薦數據;
7、其中,所述增強后的序列推薦數據用于對比學習序列推薦模型的增強訓練。
8、在本申請的第二方面,本專利技術還提出了一種基于時間間隔數據增強的對比學習序列推薦系統,包括:
9、數據采集模塊,用于獲取原始序列推薦數據,所述原始序列推薦數據為多個用戶的用戶行為序列;所述用戶行為序列為按照時間先后順序排列的用戶與項目的交互項;
10、數據處理模塊,用于將每個用戶行為序列分別劃分為多個子序列,按照每個子序列的時間標準差和序列長度確定出最長均勻子序列;
11、數據增強模塊,用于在每個用戶行為序列中替換插入最長均勻子序列,得到增強后的序列推薦數據;在不同用戶行為序列中替換最長均勻子序列,得到增強后的序列推薦數據;
12、數據推薦模塊,將所述增強后的序列推薦數據用于對比學習序列推薦系統的增強訓練。
13、本申請的有益效果:
14、本申請提出了一種基于時間間隔數據增強的對比學習序列推薦方法及系統。它既考慮全局序列又考慮局部序列的均勻性。通過在相關項目之間插入新的項目,可以確保局部序列的時間差異減小,這有助于更好地捕捉用戶短期內的興趣變化。選擇最長子序列保證其與全局序列達到足夠的相似性。插入的項目(item)也與周圍項目更相似,這樣可以保持推薦的一致性和連貫性。從而進一步保證了對比學習序列推薦模型的準確性。
本文檔來自技高網...【技術保護點】
1.一種基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述方法包括:
2.根據權利要求1所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述將每個用戶行為序列分別劃分為多個子序列,按照每個子序列的時間標準差和序列長度確定出最長均勻子序列包括:
3.根據權利要求2所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述目標位置的確定公式表示為:
4.根據權利要求3所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述標準差最小且長度最大的擴增子序列的計算公式表示為:
5.根據權利要求1所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述將每個用戶行為序列分別劃分為多個子序列,按照每個子序列的時間標準差和序列長度確定出最長均勻子序列包括:
6.根據權利要求5所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述第一用戶行為序列中的待替換子序列與第二用戶行為序列中的待替換子序列具有至少三個相同的項目。
7.根據權利要求6所述的基于時間間隔數據增
8.根據權利要求1所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述對比學習序列推薦系統采用超越自注意力機制;所述超越自注意力機制采用傅里葉變換平衡歸納偏置與自注意力機制。
9.一種基于時間間隔數據增強的對比學習序列推薦系統,其特征在于,包括:
...【技術特征摘要】
1.一種基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述方法包括:
2.根據權利要求1所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述將每個用戶行為序列分別劃分為多個子序列,按照每個子序列的時間標準差和序列長度確定出最長均勻子序列包括:
3.根據權利要求2所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述目標位置的確定公式表示為:
4.根據權利要求3所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述標準差最小且長度最大的擴增子序列的計算公式表示為:
5.根據權利要求1所述的基于時間間隔數據增強的對比學習序列推薦方法,其特征在于,所述將每個用戶行為序列分別劃分為多個子序列...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。