System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 无码专区狠狠躁躁天天躁,精品无码久久久久久久久久,白嫩少妇激情无码
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    模型訓練方法、推薦數據點擊率的預測方法和電子設備技術

    技術編號:43611797 閱讀:10 留言:0更新日期:2024-12-11 14:56
    本說明書實施例提出一種模型訓練方法、推薦數據點擊率的預測方法和電子設備,上述模型訓練方法中,獲取目標域樣本數據和所述目標樣本數據對應的點擊率的標簽值之后,首先分別通過學生模型中的第一表征解耦模型和第二表征解耦模型,以及已完成參數調整的老師模型中的域分類器,獲得域共享表征向量和域獨有表征向量,然后根據域共享表征向量和域獨有表征向量,通過學生模型中的點擊率預測模型獲得目標域樣本數據對應的點擊率的第一預測值,最后,以最小化學生模型的損失函數為目的,調整點擊率預測模型、第一表征解耦模型和第二表征解耦模型的參數,其中,學生模型的損失函數包括目標域樣本數據對應的點擊率的標簽值和第一預測值之間的交叉熵。

    【技術實現步驟摘要】

    【】本說明書實施例涉及互聯網,尤其涉及一種模型訓練方法、推薦數據點擊率的預測方法和電子設備。


    技術介紹

    0、
    技術介紹

    1、互聯網和信息技術的飛速發展,在為人們提供了便利的同時,也產生了海量的數據。用戶要從海量的數據中快速提取自己感興趣的信息,最直接的方式是搜索引擎和推薦系統。

    2、現有的推薦系統普遍存在數據稀疏問題,導致推薦系統無法很好地刻畫用戶的喜好,對于用戶點擊率的預測較差,從而使得推薦系統的推薦效果較差,其中,數據稀疏是指數據集中某些特征的取值較少,或者某些樣本的標簽缺失。因此,需要提供一種方案,緩解推薦系統的數據稀疏問題,對目標場景中的用戶和待推薦數據進行更豐富地刻畫。


    技術實現思路

    0、
    技術實現思路

    1、本說明書實施例提供了一種模型訓練方法、推薦數據點擊率的預測方法和電子設備,以緩解推薦系統的數據稀疏問題,對目標場景中的用戶和待推薦數據進行豐富地刻畫,提高待推薦數據的點擊率,進而提升推薦系統的推薦效果。

    2、第一方面,本說明書實施例提供一種模型訓練方法,包括:獲取目標域樣本數據和所述目標樣本數據對應的點擊率的標簽值;通過學生模型中的第一表征解耦模型,將所述目標域樣本數據編碼為第一表征向量,并通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分,使得所述第一表征向量被學習為域共享表征向量;以及通過所述學生模型中的第二表征解耦模型,將所述目標域樣本數據編碼為第二表征向量,并通過所述域分類器對所述第二表征向量進行評分,使得所述第二表征向量被學習為域獨有表征向量;根據所述域共享表征向量和所述域獨有表征向量,通過所述學生模型中的點擊率預測模型獲得所述目標域樣本數據對應的點擊率的第一預測值;以最小化所述學生模型的損失函數為目的,調整所述點擊率預測模型、所述第一表征解耦模型和所述第二表征解耦模型的參數;其中,所述學生模型的損失函數包括所述目標域樣本數據對應的點擊率的標簽值和所述第一預測值之間的交叉熵。

    3、上述模型訓練方法中,獲取目標域樣本數據和上述目標樣本數據對應的點擊率的標簽值之后,分別通過學生模型中的第一表征解耦模型和第二表征解耦模型,以及已完成參數調整的老師模型中的域分類器獲得域共享表征向量和域獨有表征向量,然后根據上述域共享表征向量和上述域獨有表征向量,通過學生模型中的點擊率預測模型獲得上述目標域樣本數據對應的點擊率的第一預測值,最后,以最小化上述學生模型的損失函數為目的,調整上述點擊率預測模型、第一表征解耦模型和第二表征解耦模型的參數,其中,上述學生模型的損失函數包括目標域樣本數據對應的點擊率的標簽值和第一預測值之間的交叉熵。從而可以實現將域共享表征向量與域獨有表征向量進行解耦,并分別加以利用,由于域共享表征向量為適宜遷移的表征向量,因此上述方法可以實現跨域知識遷移,而域獨有表征向量包含目標域的專有知識,因此可以利用其中的自監督信息,緩解目標域的數據稀疏問題,這樣,利用上述域共享表征向量和域獨有表征向量,訓練獲得的第一表征解耦模型、第二表征解耦模型和點擊率預測模型可以對目標場景中的用戶和待推薦數據進行豐富地刻畫,進而可以提高上述模型對待推薦數據的點擊率的預測準確性,提升推薦系統的推薦效果。

    4、其中一種可能的實現方式中,所述通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分,使得所述第一表征向量被學習為域共享表征向量包括:以最小化所述域分類器對所述第一表征向量的評分與第一預定分布之間的交叉熵為目的,調整所述第一表征解耦模型的參數,使得所述第一表征向量被學習為域共享表征向量。

    5、其中一種可能的實現方式中,所述通過所述域分類器對所述第二表征向量進行評分,使得所述第二表征向量被學習為域獨有表征向量包括:以最小化所述域分類器對所述第二表征向量的評分與第二預定分布之間的交叉熵為目的,調整所述第二表征解耦模型的參數,使得所述第二表征向量被學習為域獨有表征向量。

    6、其中一種可能的實現方式中,所述獲取目標域樣本數據之后,還包括:通過所述老師模型中的編碼器,將所述目標域樣本數據編碼為第三表征向量;以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的,調整所述第一表征解耦模型的參數。

    7、其中一種可能的實現方式中,所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的,調整所述第一表征解耦模型的參數之前,還包括:通過所述域分類器對所述目標域樣本數據進行評分;根據所述目標域樣本數據的得分,確定所述目標域樣本數據的權重;通過所述目標域樣本數據的權重,對所述第三表征向量與所述域共享表征向量之間的距離進行加權。

    8、其中一種可能的實現方式中,所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的,調整所述第一表征解耦模型的參數包括:以最小化加權后的所述距離為目的,調整所述第一表征解耦模型的參數;其中,所述距離為所述第三表征向量與所述域共享表征向量之間的距離。

    9、其中一種可能的實現方式中,所述獲取目標域樣本數據之后,還包括:通過所述第二表征解耦模型中的嵌入層,將所述目標域樣本數據轉換為第四表征向量;對所述第四表征向量進行隨機擾動操作,獲得第五表征向量和第六表征向量;通過所述第二表征解耦模型中的編碼器,分別對所述第五表征向量和所述第六表征向量進行編碼,獲得第七表征向量和第八表征向量;以最大化所述第七表征向量和所述第八表征向量之間的相似度為目的,調整所述第二表征解耦模型中的編碼器的參數。

    10、其中一種可能的實現方式中,所述通過所述老師模型中的編碼器,將所述目標域樣本數據編碼為第三表征向量之后,還包括:根據所述第三表征向量,通過所述老師模型中的預測模型獲得所述目標域樣本數據對應的點擊率的第二預測值;所述學生模型的損失函數還包括:通過所述目標域樣本數據的權重加權后的差值,所述差值為所述第一預測值與所述第二預測值之間的差值。

    11、其中一種可能的實現方式中,所述通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分之前,還包括:獲取多域樣本數據、所述多域樣本數據對應的點擊率的標簽值和所述多域樣本數據所屬域的標簽值;其中,所述多域樣本數據包括源域樣本數據和目標域樣本數據;通過老師模型中的嵌入層,將所述多域樣本數據轉換為第九表征向量;通過所述老師模型中的編碼器,將所述第九表征向量編碼為第十表征向量;根據所述第十表征向量,通過所述老師模型中的預測模型預測所述多域樣本數據對應的點擊率的預測值;以及通過所述老師模型中的梯度反傳層將所述第十表征向量轉換為第十一表征向量,通過所述老師模型中的域分類器,對所述第十一表征向量進行分類,獲得所述多域樣本數據所屬域的預測值;以最小化所述老師模型的損失函數為目的,調整所述老師模型中的編碼器、所述梯度反傳層、所述域分類器和所述預測模型的參數;其中,所述老師模型的損失函數為所述多域樣本數據對應的點擊率的標簽值與預測值之間的交叉熵,以及所述多域樣本數據所屬域的標簽值與預測值之間的交叉熵之本文檔來自技高網...

    【技術保護點】

    1.一種模型訓練方法,包括:

    2.根據權利要求1所述的方法,其中,所述通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分,使得所述第一表征向量被學習為域共享表征向量包括:

    3.根據權利要求1所述的方法,其中,所述通過所述域分類器對所述第二表征向量進行評分,使得所述第二表征向量被學習為域獨有表征向量包括:

    4.根據權利要求1或2所述的方法,其中,所述獲取目標域樣本數據之后,還包括:

    5.根據權利要求4所述的方法,其中,所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的,調整所述第一表征解耦模型的參數之前,還包括:

    6.根據權利要求5所述的方法,其中,所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的,調整所述第一表征解耦模型的參數包括:

    7.根據權利要求1或3所述的方法,其中,所述獲取目標域樣本數據之后,還包括:

    8.根據權利要求5所述的方法,其中,所述通過所述老師模型中的編碼器,將所述目標域樣本數據編碼為第三表征向量之后,還包括:

    9.根據權利要求1所述的方法,其中,所述通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分之前,還包括:

    10.一種推薦數據點擊率的預測方法,包括:

    11.一種電子設備,包括:

    12.一種非暫態計算機可讀存儲介質,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令使所述計算機執行如權利要求1至9任一所述的方法;或者所述計算機指令使所述計算機執行如權利要求10所述的方法。

    ...

    【技術特征摘要】

    1.一種模型訓練方法,包括:

    2.根據權利要求1所述的方法,其中,所述通過已完成參數調整的老師模型中的域分類器對所述第一表征向量進行評分,使得所述第一表征向量被學習為域共享表征向量包括:

    3.根據權利要求1所述的方法,其中,所述通過所述域分類器對所述第二表征向量進行評分,使得所述第二表征向量被學習為域獨有表征向量包括:

    4.根據權利要求1或2所述的方法,其中,所述獲取目標域樣本數據之后,還包括:

    5.根據權利要求4所述的方法,其中,所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的,調整所述第一表征解耦模型的參數之前,還包括:

    6.根據權利要求5所述的方法,其中,所述以最小化所述第三表征向量與所述域共享表征向量之間的距離為目的...

    【專利技術屬性】
    技術研發人員:顧喆旭,安志成,俞力,涂珂,吳鄭偉,胡斌斌,張志強,顧立宏,顧進杰
    申請(專利權)人:支付寶杭州信息技術有限公司,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲熟妇无码八AV在线播放 | 久久久精品天堂无码中文字幕| 国产无码一区二区在线| 无码精品人妻一区二区三区免费 | 亚洲人成无码网站| 亚洲国产成AV人天堂无码| 国产精品无码久久av不卡 | 久久精品中文字幕无码绿巨人 | 欧洲人妻丰满av无码久久不卡 | 无码人妻精品一区二区蜜桃 | 潮喷无码正在播放| 无码国内精品久久综合88| 国产成人年无码AV片在线观看 | 亚洲AV无码乱码在线观看裸奔| 亚洲a∨无码精品色午夜| 无码国内精品人妻少妇蜜桃视频| 无码精品人妻一区二区三区免费 | 色综合久久无码五十路人妻| 亚洲一级Av无码毛片久久精品| 亚洲精品无码不卡在线播放| 日韩乱码人妻无码中文字幕 | 亚洲国产成人无码av在线播放 | 无码国产精品一区二区免费式影视 | 亚洲Av永久无码精品一区二区| 亚洲av无码成人黄网站在线观看| AV无码精品一区二区三区宅噜噜| 精品无码久久久久久久久| 精品少妇人妻AV无码专区不卡| 麻豆AV无码精品一区二区| 久久久久久人妻无码| 蜜桃成人无码区免费视频网站| 午夜人性色福利无码视频在线观看| 在线精品自拍无码| 伊人久久无码中文字幕| 亚洲AV永久无码精品| 日韩欧精品无码视频无删节| 2021无码最新国产在线观看| 亚洲国产精品无码第一区二区三区 | 中文字幕无码毛片免费看| 国产在线无码精品电影网| 中文有无人妻vs无码人妻激烈 |