System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于序列推薦,具體涉及一種基于解耦對比學習的文本表征對齊序列推薦方法。
技術介紹
1、順序推薦的目標是通過在在線平臺上建模他們的歷史交互序列,如瀏覽和點擊,來準確預測用戶可能感興趣的下一個項目。隨著預訓練語言模型(pre-trained?languagemodels)的發展,特別是bert(bidirectional?encoder?representation?fromtransformers,bert)在機器翻譯和基于順序文本的自然語言處理任務中的成功應用和推薦,出現了處理順序文本數據的可行解決方案。這些模型展示了理解文本語義和提取信息的令人印象深刻的能力。在此基礎上,本研究的基本思想是使用bert等預訓練好的模型對項目的富文本信息進行編碼,以提取用戶對序列的興趣表示,并提高推薦性能。這些模型生成項目文本表示(例如,標題),并學習項目和序列表示,通過將序列表示與目標項目的文本語義表示對齊,直接優化用戶的興趣表示。在此過程中,推薦數據中的目標項的文本表示作為一個監督信號。然而,這種方法有幾個局限性:(1)單向強調與下一個項目的語義對齊,導致模型對與正項目相關的訓練數據中的模式過度過擬合,導致偏置的興趣表征。(2)這種方法忽略了雙向監督在實現全面的語義表示方面的好處,導致了不完整的序列表示和語義匹配偏差。
技術實現思路
1、為解決上述技術問題,本專利技術的目的在于提供一種基于解耦對比學習的文本表征對齊序列推薦方法,本專利技術提出了解耦序列和項目表示,并獨立學習它們,以避免
2、為實現上述目的,本專利技術提出了一種基于解耦對比學習的文本表征對齊序列推薦方法,包括以下步驟:
3、步驟1:將物品的多種屬性描述文本按順序連接,構建基于文本描述的序列-物品推薦數據;
4、步驟2:基于預訓練語言模型創建物品的描述文本語義編碼器,將物品的文本描述作為輸入,輸出其描述文本相應的文本語義向量表示,作為物品文本表征;
5、步驟3:基于預訓練語言模型創建序列的描述文本語義編碼器,將序列的文本描述作為輸入,輸出其描述文本相應的文本語義向量表示,作為序列文本表征;
6、步驟4:分別基于步驟2和步驟3中得到的物品文本表征、序列文本表征構建無監督對比學習任務,學習序列和目標物品的解耦表示;
7、步驟5:基于步驟2和步驟3中得到的序列文本表征與物品文本表征構建有監督雙向對比學習任務,實現序列及其目標物品之間的雙向語義對齊;
8、步驟6:利用多任務訓練策略聯合優化步驟4和步驟5中無監督與有監督的對比學習訓練任務的損失函數,促進序列與目標物品文本語義向量表示的深度對齊。
9、本專利技術的有益效果如下:
10、本專利技術提出的基于解耦對比學習的文本表征對齊序列推薦方法,針對模型訓練過程中強調與單向語義對齊中導致模型對與正項目相關的訓練數據中的模式過度擬合,導致語義匹配偏差和偏置的興趣表征問題,通過解耦序列和項目表征空間獨立學習它們文本語義向量表示,并采用序列文本語義向量表示與目標物品文本語義向量表示雙向有監督對齊的方式,以實現序列表征的高質量優化,最終實現提高推薦性能的目的,從而解決了上述
技術介紹
中提到的問題。
【技術保護點】
1.一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,所述步驟1具體包括以下子步驟:
3.根據權利要求2所述的一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,所述步驟2具體如下:
4.根據權利要求3所述的一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,所述步驟3具體為:
5.根據權利要求4所述的一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,所述步驟4具體為:
6.根據權利要求5所述的一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,所述步驟5具體為:
7.根據權利要求6所述的一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,訓練過程中的總損失函數如下:
【技術特征摘要】
1.一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,所述步驟1具體包括以下子步驟:
3.根據權利要求2所述的一種基于解耦對比學習的文本表征對齊序列推薦方法,其特征在于,所述步驟2具體如下:
4.根據權利要求3所述的一種基于解耦對比學習的文本表征對齊序列...
【專利技術屬性】
技術研發人員:劉嶠,佟飄,王玉柯,謝煬,代婷婷,甘洋鐳,侯睿,藍天,
申請(專利權)人:電子科技大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。