模型訓練方法、推薦數據點擊率的預測方法和電子設備技術

技術編號：43611797 閱讀：10 留言：0更新日期：2024-12-11 14:56

本說明書實施例提出一種模型訓練方法、推薦數據點擊率的預測方法和電子設備，上述模型訓練方法中，獲取目標域樣本數據和所述目標樣本數據對應的點擊率的標簽值之后，首先分別通過學生模型中的第一表征解耦模型和第二表征解耦模型，以及已完成參數調整的老師模型中的域分類器，獲得域共享表征向量和域獨有表征向量，然后根據域共享表征向量和域獨有表征向量，通過學生模型中的點擊率預測模型獲得目標域樣本數據對應的點擊率的第一預測值，最后，以最小化學生模型的損失函數為目的，調整點擊率預測模型、第一表征解耦模型和第二表征解耦模型的參數，其中，學生模型的損失函數包括目標域樣本數據對應的點擊率的標簽值和第一預測值之間的交叉熵。

全部詳細技術資料下載

【技術實現步驟摘要】

【】本說明書實施例涉及互聯網，尤其涉及一種模型訓練方法、推薦數據點擊率的預測方法和電子設備。

技術介紹

0、
技術介紹

1、互聯網和信息技術的飛速發展，在為人們提供了便利的同時，也產生了海量的數據。用戶要從海量的數據中快速提取自己感興趣的信息，最直接的方式是搜索引擎和推薦系統。

2、現有的推薦系統普遍存在數據稀疏問題，導致推薦系統無法很好地刻畫用戶的喜好，對于用戶點擊率的預測較差，從而使得推薦系統的推薦效果較差，其中，數據稀疏是指數據集中某些特征的取值較少，或者某些樣本的標簽缺失。因此，需要提供一種方案，緩解推薦系統的數據稀疏問題，對目標場景中的用戶和待推薦數據進行更豐富地刻畫。

技術實現思路

0、
技術實現思路

1、本說明書實施例提供了一種模型訓練方法、推薦數據點擊率的預測方法和電子設備，以緩解推薦系統的數據稀疏問題，對目標場景中的用戶和待推薦數據進行豐富地刻畫，提高待推薦數據的點擊率，進而提升推薦系統的推薦效果。

2、第一方面，本說明書實施例提供一種模型訓練方法，包括：獲取目標域樣本數據和所述目標樣本數據對應的點擊率的標簽值；通過學生模型中的第一表征解耦模型，將所述目標域樣本數據編碼為第一表征向量，并通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分，使得所述第一表征向量被學習為域共享表征向量；以及通過所述學生模型中的第二表征解耦模型，將所述目標域樣本數據編碼為第二表征向量，并通過所述域分類器對所述第二表征向量

3、上述模型訓練方法中，獲取目標域樣本數據和上述目標樣本數據對應的點擊率的標簽值之后，分別通過學生模型中的第一表征解耦模型和第二表征解耦模型，以及已完成參數調整的老師模型中的域分類器獲得域共享表征向量和域獨有表征向量，然后根據上述域共享表征向量和上述域獨有表征向量，通過學生模型中的點擊率預測模型獲得上述目標域樣本數據對應的點擊率的第一預測值，最后，以最小化上述學生模型的損失函數為目的，調整上述點擊率預測模型、第一表征解耦模型和第二表征解耦模型的參數，其中，上述學生模型的損失函數包括目標域樣本數據對應的點擊率的標簽值和第一預測值之間的交叉熵。從而可以實現將域共享表征向量與域獨有表征向量進行解耦，并分別加以利用，由于域共享表征向量為適宜遷移的表征向量，因此上述方法可以實現跨域知識遷移，而域獨有表征向量包含目標域的專有知識，因此可以利用其中的自監督信息，緩解目標域的數據稀疏問題，這樣，利用上述域共享表征向量和域獨有表征向量，訓練獲得的第一表征解耦模型、第二表征解耦模型和點擊率預測模型可以對目標場景中的用戶和待推薦數據進行豐富地刻畫，進而可以提高上述模型對待推薦數據的點擊率的預測準確性，提升推薦系統的推薦效果。

4、其中一種可能的實現方式中，所述通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分，使得所述第一表征向量被學習為域共享表征向量包括：以最小化所述域分類器對所述第一表征向量的評分與第一預定分布之間的交叉熵為目的，調整所述第一表征解耦模型的參數，使得所述第一表征向量被學習為域共享表征向量。

5、其中一種可能的實現方式中，所述通過所述域分類器對所述第二表征向量進行評分，使得所述第二表征向量被學習為域獨有表征向量包括：以最小化所述域分類器對所述第二表征向量的評分與第二預定分布之間的交叉熵為目的，調整所述第二表征解耦模型的參數，使得所述第二表征向量被學習為域獨有表征向量。

6、其中一種可能的實現方式中，所述獲取目標域樣本數據之后，還包括：通過所述老師模型中的編碼器，將所述目標域樣本數據編碼為第三表征向量；以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的，調整所述第一表征解耦模型的參數。

7、其中一種可能的實現方式中，所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的，調整所述第一表征解耦模型的參數之前，還包括：通過所述域分類器對所述目標域樣本數據進行評分；根據所述目標域樣本數據的得分，確定所述目標域樣本數據的權重；通過所述目標域樣本數據的權重，對所述第三表征向量與所述域共享表征向量之間的距離進行加權。

8、其中一種可能的實現方式中，所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的，調整所述第一表征解耦模型的參數包括：以最小化加權后的所述距離為目的，調整所述第一表征解耦模型的參數；其中，所述距離為所述第三表征向量與所述域共享表征向量之間的距離。

9、其中一種可能的實現方式中，所述獲取目標域樣本數據之后，還包括：通過所述第二表征解耦模型中的嵌入層，將所述目標域樣本數據轉換為第四表征向量；對所述第四表征向量進行隨機擾動操作，獲得第五表征向量和第六表征向量；通過所述第二表征解耦模型中的編碼器，分別對所述第五表征向量和所述第六表征向量進行編碼，獲得第七表征向量和第八表征向量；以最大化所述第七表征向量和所述第八表征向量之間的相似度為目的，調整所述第二表征解耦模型中的編碼器的參數。

10、其中一種可能的實現方式中，所述通過所述老師模型中的編碼器，將所述目標域樣本數據編碼為第三表征向量之后，還包括：根據所述第三表征向量，通過所述老師模型中的預測模型獲得所述目標域樣本數據對應的點擊率的第二預測值；所述學生模型的損失函數還包括：通過所述目標域樣本數據的權重加權后的差值，所述差值為所述第一預測值與所述第二預測值之間的差值。

11、其中一種可能的實現方式中，所述通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分之前，還包括：獲取多域樣本數據、所述多域樣本數據對應的點擊率的標簽值和所述多域樣本數據所屬域的標簽值；其中，所述多域樣本數據包括源域樣本數據和目標域樣本數據；通過老師模型中的嵌入層，將所述多域樣本數據轉換為第九表征向量；通過所述老師模型中的編碼器，將所述第九表征向量編碼為第十表征向量；根據所述第十表征向量，通過所述老師模型中的預測模型預測所述多域樣本數據對應的點擊率的預測值；以及通過所述老師模型中的梯度反傳層將所述第十表征向量轉換為第十一表征向量，通過所述老師模型中的域分類器，對所述第十一表征向量進行分類，獲得所述多域樣本數據所屬域的預測值；以最小化所述老師模型的損失函數為目的，調整所述老師模型中的編碼器、所述梯度反傳層、所述域分類器和所述預測模型的參數；其中，所述老師模型的損失函數為所述多域樣本數據對應的點擊率的標簽值與預測值之間的交叉熵，以及所述多域樣本數據所屬域的標簽值與預測值之間的交叉熵之本文檔來自技高網...

【技術保護點】

1.一種模型訓練方法，包括：

2.根據權利要求1所述的方法，其中，所述通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分，使得所述第一表征向量被學習為域共享表征向量包括：

3.根據權利要求1所述的方法，其中，所述通過所述域分類器對所述第二表征向量進行評分，使得所述第二表征向量被學習為域獨有表征向量包括：

4.根據權利要求1或2所述的方法，其中，所述獲取目標域樣本數據之后，還包括：

5.根據權利要求4所述的方法，其中，所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的，調整所述第一表征解耦模型的參數之前，還包括：

6.根據權利要求5所述的方法，其中，所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的，調整所述第一表征解耦模型的參數包括：

7.根據權利要求1或3所述的方法，其中，所述獲取目標域樣本數據之后，還包括：

8.根據權利要求5所述的方法，其中，所述通過所述老師模型中的編碼器，將所述目標域樣本數據編碼為第三表征向量之后，還包括：

9.根據權

10.一種推薦數據點擊率的預測方法，包括：

11.一種電子設備，包括：

12.一種非暫態計算機可讀存儲介質，所述非暫態計算機可讀存儲介質存儲計算機指令，所述計算機指令使所述計算機執行如權利要求1至9任一所述的方法；或者所述計算機指令使所述計算機執行如權利要求10所述的方法。

...

【技術特征摘要】

1.一種模型訓練方法，包括：

3.根據權利要求1所述的方法，其中，所述通過所述域分類器對所述第二表征向量進行評分，使得所述第二表征向量被學習為域獨有表征向量包括：

4.根據權利要求1或2所述的方法，其中，所述獲取目標域樣本數據之后，還包括：

6.根據權利要求5所述的方法，其中，所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的...

【專利技術屬性】
技術研發人員：顧喆旭，安志成，俞力，涂珂，吳鄭偉，胡斌斌，張志強，顧立宏，顧進杰，
申請(專利權)人：支付寶杭州信息技術有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術