System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機處理,尤其涉及一種模型訓練方法、召回方法、裝置、設備及存儲介質。
技術介紹
1、召回模型(retrieval?model)主要是從海量的候選博文集合中召回千數的博文,然后輸入到下游的排序模型。通過排序模型對召回結果進行精細化的排序和打分,最終篩選出最符合用戶當前需求的博文顯示給用戶。
2、相關技術中,單路召回模型往往因自身性能存在一定局限性,導致召回效果不佳,因此推薦系統可以采用多路召回方式,即利用多個單路召回模型分別進行召回,然后匯總各個單路召回模型召回的博文,輸入到下游排序模型。然而由于多個單路召回模型彼此獨立,這些模型之間的召回效果可能存在相似的問題,不僅浪費模型訓練和推理成本,而且多個單路召回模型的總體召回效果也無法相對于其中的單個模型有所提升,總體召回效果不佳。
技術實現思路
1、本申請提供一種模型訓練方法、召回方法、裝置、設備及存儲介質,可以提高多路召回的召回效果。
2、第一方面,本申請提供一種召回模型的訓練方法,包括:獲取訓練樣本以及與訓練樣本對應的樣本標簽,訓練樣本包括樣本用戶的用戶特征以及向樣本用戶曝光的樣本博文的博文特征和博主特征,樣本標簽表征樣本博文是否被樣本用戶點擊、以及樣本博文被點擊的原因;根據博文特征,通過初始召回模型的博文熱度預測模塊確定博文熱度得分,博文熱度得分表征樣本博文的受歡迎程度;根據用戶特征、博文特征和博主特征,通過初始召回模型的用戶偏好預測模塊確定用戶偏好得分,用戶偏好得分表征樣本用戶對于樣本博文的偏
3、在一些可能的實施方式中,用戶偏好預測模塊包括第一偏好預測子模塊和第二偏好預測子模塊,用戶偏好得分包括第一偏好得分和第二偏好得分;根據用戶特征、博文特征和博主特征,通過初始召回模型的用戶偏好預測模塊確定用戶偏好得分,包括:根據用戶特征和博文特征,通過第一偏好預測子模塊確定第一偏好得分,第一偏好得分表征樣本用戶對于樣本博文的博文偏好程度;根據用戶特征和博主特征,通過第二偏好預測子模塊確定第二偏好得分,第二偏好得分表征樣本用戶對于樣本博文對應的博主的偏好程度。
4、在一些可能的實施方式中,根據博文熱度得分和用戶偏好得分,通過初始召回模型的輸出模塊確定樣本博文的召回預測結果,包括:根據用戶特征,通過輸出模塊確定第一權重值、第二權重值和第三權重值,第一權重值表征博文熱度的權重,第二權重值表征用戶對博文偏好的權重,第三權重值表征用戶對博主偏好的權重;通過輸出模塊根據第一權重值、第二權重值和第三權重值,對博文熱度得分、第一偏好得分和第二偏好得分進行加權求和,得到召回預測結果。
5、在一些可能的實施方式中,樣本標簽包括樣本博文是否被樣本用戶點擊的點擊標簽、樣本博文的博文熱度標簽、樣本博文的用戶偏好標簽,博文熱度標簽表征樣本博文被點擊的原因是否為博文熱度,用戶偏好標簽表征樣本博文被點擊的原因是否為用戶偏好;通過召回預測結果、博文熱度得分、用戶偏好得分、以及與訓練樣本對應的樣本標簽,計算損失值以調整初始召回模型的參數,直至初始召回模型收斂,得到召回模型,包括:根據召回預測結果、以及樣本博文的點擊標簽,確定初始召回模型的第一損失值;根據第一損失值、博文熱度得分、用戶偏好得分、樣本博文的博文熱度標簽,以及樣本博文的用戶偏好標簽,確定初始召回模型的總損失值;通過總損失值調整初始召回模型的參數,直至初始召回模型收斂,得到召回模型。
6、在一些可能的實施方式中,用戶偏好標簽包括用戶對博文的偏好子標簽和用戶對博主的偏好子標簽;根據第一損失值、博文熱度得分、用戶偏好得分、樣本博文的博文熱度標簽,以及樣本用戶的用戶偏好標簽,確定所述初始召回模型的總損失值,包括:根據博文熱度得分和樣本博文的博文熱度標簽,通過博文熱度預測模塊確定第二損失值;根據第一偏好得分和樣本博文的用戶對博文的偏好子標簽,通過第一偏好預測子模塊確定第三損失值;根據第二偏好得分和樣本博文的用戶對博主的偏好子標簽,通過第二偏好預測子模塊確定第四損失值;根據第一損失值、第二損失值、第三損失值以及第四損失值,確定總損失值。
7、第二方面,本申請提供一種召回模型,該方法包括:獲取目標用戶的用戶特征和多個候選博文的博文特征和博主特征;根據用戶特征、博文特征和博主特征,通過召回模型確定每個候選博文的召回預測結果,召回模型是基于第一方面所述的方法訓練得到的;根據召回預測結果,從多個候選博文中召回目標博文。
8、在一些可能的實施方式中,根據用戶特征、博文特征和博主特征,通過召回模型確定每個候選博文的召回預測結果,包括:針對任一候選博文,根據博文特征,通過召回模型的博文熱度預測模塊確定博文熱度得分,博文熱度得分表征候選博文的受歡迎程度;根據用戶特征、博文特征和博主特征,通過召回模型的用戶偏好預測模塊確定用戶偏好得分,用戶偏好得分表征目標用戶對于候選博文的偏好程度;根據博文熱度得分和用戶偏好得分,通過召回模型的輸出模塊確定候選博文的召回預測結果。
9、在一些可能的實施方式中,用戶偏好預測模塊包括第一偏好預測子模塊和第二偏好預測子模塊,用戶偏好得分包括第一偏好得分和第二偏好得分;根據用戶特征、博文特征和博主特征,通過召回模型的用戶偏好預測模塊確定用戶偏好得分,包括:根據用戶特征和博文特征,通過第一偏好預測子模塊確定第一偏好得分,第一偏好得分表征目標用戶對于候選博文的博文偏好程度;根據用戶特征和博主特征,通過第二偏好預測子模塊確定第二偏好得分,第二偏好得分表征目標用戶對于候選博文對應的博主的偏好程度。
10、在一些可能的實施方式中,根據博文熱度得分和用戶偏好得分,通過召回模型的輸出模塊確定候選博文的召回預測結果,包括:根據用戶特征,通過輸出模塊確定第一權重值、第二權重值和第三權重值,第一權重值表征博文熱度的權重,第二權重值表征用戶對博文偏好的權重,第三權重值表征用戶對博主偏好的權重;通過輸出模塊根據第一權重值、第二權重值和第三權重值,對博文熱度得分、第一偏好得分和第二偏好得分進行加權求和,得到召回預測結果。
11、第三方面,本申請提供一種召回模型的訓練裝置,該裝置包括:第一獲取模塊,用于獲取訓練樣本以及與訓練樣本對應的樣本標簽,訓練樣本包括樣本用戶的用戶特征以及向樣本用戶曝光的樣本博文的博文特征和博主特征,樣本標簽表征樣本博文是否被樣本用戶點擊、以及樣本博文被點擊的原因;第一確定模塊,用于根據博文特征,通過初始召回模型的博文熱度預測模塊確定博文熱度得分,博文熱度得分表征樣本博文的受歡迎程度;第二確定模塊,用于根據用戶特征、博文特征和博主特征,通過初始召回模型的用戶偏好預測模塊確定用戶偏好得分,用戶偏好得分表征樣本用戶對于樣本博文的偏好程度;第三確定模塊,用于根據博文熱度得分和用本文檔來自技高網...
【技術保護點】
1.一種召回模型的訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述用戶偏好預測模塊包括第一偏好預測子模塊和第二偏好預測子模塊,所述用戶偏好得分包括第一偏好得分和第二偏好得分;
3.根據權利要求2所述的方法,其特征在于,所述根據所述博文熱度得分和所述用戶偏好得分,通過所述初始召回模型的輸出模塊確定所述樣本博文的召回預測結果,包括:
4.根據權利要求2所述的方法,其特征在于,所述樣本標簽包括所述樣本博文是否被所述樣本用戶點擊的點擊標簽、所述樣本博文的博文熱度標簽、所述樣本博文的用戶偏好標簽,所述博文熱度標簽表征所述樣本博文被點擊的原因是否為博文熱度,所述用戶偏好標簽表征所述樣本博文被點擊的原因是否為用戶偏好;
5.根據權利要求4所述的方法,其特征在于,所述用戶偏好標簽包括用戶對博文的偏好子標簽和用戶對博主的偏好子標簽;
6.一種召回方法,其特征在于,所述方法包括:
7.根據權利要求6所述的方法,其特征在于,所述根據所述用戶特征、所述博文特征和所述博主特征,通過召回模型確定每個候
8.一種召回裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,所述電子設備包括:
10.一種計算機可讀存儲介質,存儲有可執行指令或者計算機程序,其特征在于,所述可執行指令被處理器執行時實現權利要求1至5任一項所述的方法,或者權利要求6或7所述的方法。
...【技術特征摘要】
1.一種召回模型的訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述用戶偏好預測模塊包括第一偏好預測子模塊和第二偏好預測子模塊,所述用戶偏好得分包括第一偏好得分和第二偏好得分;
3.根據權利要求2所述的方法,其特征在于,所述根據所述博文熱度得分和所述用戶偏好得分,通過所述初始召回模型的輸出模塊確定所述樣本博文的召回預測結果,包括:
4.根據權利要求2所述的方法,其特征在于,所述樣本標簽包括所述樣本博文是否被所述樣本用戶點擊的點擊標簽、所述樣本博文的博文熱度標簽、所述樣本博文的用戶偏好標簽,所述博文熱度標簽表征所述樣本博文被點擊的原因是否為博文熱度,所述用戶偏好標簽表征所述樣本博文被點擊...
【專利技術屬性】
技術研發人員:蔡少雄,張勇,劉博,
申請(專利權)人:微夢創科網絡科技中國有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。