System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及數據處理領域,尤其涉及自然語言處理和深度學習等人工智能領域。
技術介紹
1、實現中,網站可以通過向用戶推送其感興趣的資源內容,提高用戶的粘性以及網站內容的轉化率。相關技術中,可以獲取用戶的大量歷史數據作為學習樣本,并通過對學習樣本的分析從而識別用戶需求,并基于識別到的用戶需求對用戶進行針對性的資源內容的推送。
2、可選地,針對在網站上的瀏覽痕跡較少的中長尾用戶,相較于瀏覽痕跡較多的頭部用戶的歷史數據量,中長尾用戶的歷史數據量明顯較少,在基于中長尾用戶的少量歷史數據進行分析識別該類用戶的用戶需求的場景下,較少的歷史數據量可能會對用戶需求的識別準確度存在一定程度的影響,從而導致網站針對中長尾用戶推送的資源內容與該類用戶實際需求之間的匹配程度欠佳,影響用戶體驗。
技術實現思路
1、本公開提出了一種推送指數預測模型的推送指數預測模型的訓練方法和推送內容的獲取方法。
2、根據本公開的第一方面,提出了一種推送指數預測模型的訓練方法,方法包括:獲取待訓練的候選組合模型,其中,所述候選組合模型包括候選推送指數預測模型和候選相似度識別模型;獲取樣本用戶的第一資源樣本和對應的第二資源樣本,并對所述第一資源樣本和所述第二資源樣本分別進行部分特征掩蓋,得到所述第一資源樣本掩蓋后的第一子樣本集合以及所述第二資源樣本掩蓋后的第二子樣本集合,其中,所述第一資源樣本和所述第二資源樣本不同;根據所述第一資源樣本和所述第一子樣本集合,以及所述第二資源樣本和所述第二子樣本集合,對所述候
3、根據本公開的第二方面,提出了一種推送內容的獲取方法,方法包括:獲取訓練好的目標推送指數預測模型,其中,所述目標推送指數預測模型基于上述第一方面提出的推送指數預測模型的訓練方法得到;獲取用戶端待推送的候選資源內容集合,并通過所述目標推送指數預測模型輸出所述候選資源內容集合中各候選資源內容的目標推送指數;根據所述目標推送指數由高至低的順序對各候選資源內容進行排序,得到排序后的候選資源內容隊列,并從所述候選資源內容隊列中獲取推送給所述用戶端的目標推送資源內容。
4、根據本公開的第三方面,提出了一種推送指數預測模型的訓練裝置,裝置包括:第一獲取模塊,用于獲取待訓練的候選組合模型,其中,所述候選組合模型包括候選推送指數預測模型和候選相似度識別模型;第二獲取模塊,用于獲取樣本用戶的第一資源樣本和對應的第二資源樣本,并對所述第一資源樣本和所述第二資源樣本分別進行部分特征掩蓋,得到所述第一資源樣本掩蓋后的第一子樣本集合以及所述第二資源樣本掩蓋后的第二子樣本集合,其中,所述第一資源樣本和所述第二資源樣本不同;第一訓練模塊,用于根據所述第一資源樣本和所述第一子樣本集合,以及所述第二資源樣本和所述第二子樣本集合,對所述候選組合模型進行模型訓練,得到所述候選組合模型的訓練損失;調整模塊,用于根據所述訓練損失對所述候選組合模型進行整體的參數調整,得到參數調整后的候選組合模型;第二訓練模塊,用于返回獲取下一第一資源樣本和下一第二資源樣本對參數調整后的候選組合模型繼續進行訓練,直至訓練結束,得到訓練好的目標推送指數預測模型和目標相似度識別模型組成的目標組合模型,其中,所述目標推送指數預測模型用于進行線上推送內容的確定。
5、根據本公開的第四方面,提出了一種推送內容的獲取裝置,裝置包括:第三獲取模塊,用于獲取訓練好的目標推送指數預測模型,其中,所述目標推送指數預測模型基于上述第三方面提出的推送指數預測模型的訓練裝置得到;第四獲取模塊,用于獲取用戶端待推送的候選資源內容集合,并通過所述目標推送指數預測模型輸出所述候選資源內容集合中各候選資源內容的目標推送指數;推送模塊,用于根據所述目標推送指數由高至低的順序對各候選資源內容進行排序,得到排序后的候選資源內容隊列,并從所述候選資源內容隊列中獲取推送給所述用戶端的目標推送資源內容。
6、根據本公開的第五方面,提出了一種電子設備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行上述第一方面提出的推送指數預測模型的訓練方法和/或第二方面提出的推送內容的獲取方法。
7、根據本公開的第四方面,提出了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行上述第一方面提出的推送指數預測模型的訓練方法和/或第二方面提出的推送內容的獲取方法。
8、根據本公開的第五方面,提出了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現上述第一方面提出的推送指數預測模型的訓練方法和/或第二方面提出的推送內容的獲取方法。
9、應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
本文檔來自技高網...【技術保護點】
1.一種推送指數預測模型的訓練方法,其中,所述方法包括:
2.根據權利要求1所述的方法,其中,所述根據所述訓練損失對所述候選組合模型進行整體的參數調整,得到參數調整后的候選組合模型,包括:
3.根據權利要求1所述的方法,其中,所述獲取樣本用戶的第一資源樣本和對應的第二資源樣本,并對所述第一資源樣本和所述第二資源樣本分別進行部分特征掩蓋,得到所述第一資源樣本掩蓋后的第一子樣本集合以及所述第二資源樣本掩蓋后的第二子樣本集合,其中,所述第一資源樣本和所述第二資源樣本不同,包括:
4.根據權利要求3所述的方法,其中,所述獲取所述第一資源樣本中的多個第一掩蓋特征組合,包括:
5.根據權利要求4所述的方法,其中,所述從各第一特征類型中,獲取所述第一資源樣本特征集合的多個第一掩蓋特征類型組合,包括:
6.根據權利要求3所述的方法,其中,所述獲取所述第二資源樣本中的多個第二掩蓋特征組合,包括:
7.根據權利要求6所述的方法,其中,所述從各第二候選特征類型中,獲取所述第二資源樣本特征集合的多個第二掩蓋特征類型組合,包括:
>8.根據權利要求1所述的方法,其中,所述根據所述第一資源樣本和所述第一子樣本集合,以及所述第二資源樣本和所述第二子樣本集合,對所述候選組合模型進行模型訓練,得到所述候選組合模型的訓練損失,包括:
9.根據權利要求8所述的方法,其中,所述根據所述第一資源樣本和所述第一子樣本集合,以及所述第二資源樣本和所述第二子樣本集合,獲取所述候選推送指數預測模型的第一訓練樣本以及所述候選相似度識別模型的第二訓練樣本,包括:
10.根據權利要求9所述的方法,其中,所述對所述第一子樣本集合中的各第一子樣本以及所述第二子樣本集合中的各第二子樣本進行兩兩配對,得到所述候選相似度識別模型的所述第二訓練樣本,包括:
11.根據權利要求8所述的方法,其中,所述基于所述第一訓練樣本獲取所述候選推送指數預測模型的第一損失值,包括:
12.根據權利要求8所述的方法,其中,所述基于所述第二訓練樣本獲取所述候選相似度識別模型的第二損失值,包括:
13.根據權利要求8所述的方法,其中,所述基于所述第一損失值和所述第二損失值,獲取所述候選推送指數預測模型和所述候選相似度識別模型的所述候選組合模型的所述訓練損失,包括:
14.一種推送內容的獲取方法,其中,所述方法包括:
15.一種推送指數預測模型的訓練裝置,其中,所述裝置包括:
16.根據權利要求15所述的裝置,其中,所述調整模塊,還用于:
17.根據權利要求15所述的裝置,其中,所述第二獲取模塊,還用于:
18.根據權利要求17所述的裝置,其中,所述第二獲取模塊,還用于:
19.根據權利要求18所述的裝置,其中,所述第二獲取模塊,還用于:
20.根據權利要求17所述的裝置,其中,所述第二獲取模塊,還用于:
21.根據權利要求20所述的裝置,其中,所述第二獲取模塊,還用于:
22.根據權利要求15所述的裝置,其中,所述第一訓練模塊,還用于:
23.根據權利要求22所述的裝置,其中,所述第一訓練模塊,還用于:
24.根據權利要求23所述的裝置,其中,所述第一訓練模塊,還用于:
25.根據權利要求22所述的裝置,其中,所述第一訓練模塊,還用于:
26.根據權利要求22所述的裝置,其中,所述第一訓練模塊,還用于:
27.根據權利要求22所述的裝置,其中,所述第一訓練模塊,還用于:
28.一種推送內容的獲取裝置,其中,所述裝置包括:
29.一種電子設備,包括:
30.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行根據權利要求1-13和/或權利要求14中任一項所述的方法。
31.一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現根據權利要求1-13和/或權利要求14中任一項所述的方法。
...【技術特征摘要】
1.一種推送指數預測模型的訓練方法,其中,所述方法包括:
2.根據權利要求1所述的方法,其中,所述根據所述訓練損失對所述候選組合模型進行整體的參數調整,得到參數調整后的候選組合模型,包括:
3.根據權利要求1所述的方法,其中,所述獲取樣本用戶的第一資源樣本和對應的第二資源樣本,并對所述第一資源樣本和所述第二資源樣本分別進行部分特征掩蓋,得到所述第一資源樣本掩蓋后的第一子樣本集合以及所述第二資源樣本掩蓋后的第二子樣本集合,其中,所述第一資源樣本和所述第二資源樣本不同,包括:
4.根據權利要求3所述的方法,其中,所述獲取所述第一資源樣本中的多個第一掩蓋特征組合,包括:
5.根據權利要求4所述的方法,其中,所述從各第一特征類型中,獲取所述第一資源樣本特征集合的多個第一掩蓋特征類型組合,包括:
6.根據權利要求3所述的方法,其中,所述獲取所述第二資源樣本中的多個第二掩蓋特征組合,包括:
7.根據權利要求6所述的方法,其中,所述從各第二候選特征類型中,獲取所述第二資源樣本特征集合的多個第二掩蓋特征類型組合,包括:
8.根據權利要求1所述的方法,其中,所述根據所述第一資源樣本和所述第一子樣本集合,以及所述第二資源樣本和所述第二子樣本集合,對所述候選組合模型進行模型訓練,得到所述候選組合模型的訓練損失,包括:
9.根據權利要求8所述的方法,其中,所述根據所述第一資源樣本和所述第一子樣本集合,以及所述第二資源樣本和所述第二子樣本集合,獲取所述候選推送指數預測模型的第一訓練樣本以及所述候選相似度識別模型的第二訓練樣本,包括:
10.根據權利要求9所述的方法,其中,所述對所述第一子樣本集合中的各第一子樣本以及所述第二子樣本集合中的各第二子樣本進行兩兩配對,得到所述候選相似度識別模型的所述第二訓練樣本,包括:
11.根據權利要求8所述的方法,其中,所述基于所述第一訓練樣本獲取所述候選推送指數預測模型的第一損失值,包括:
12.根據權利要求8所...
【專利技術屬性】
技術研發人員:吳學超,王爽旭,祝帥,劉星,
申請(專利權)人:北京百度網訊科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。