System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
【國外來華專利技術】
本公開總體上涉及樣本處理,并且更具體地,涉及用于基于將樣本的標簽從第一標簽空間映射到第二標簽空間的樣本處理的方法、設備和計算機程序產品。
技術介紹
1、目前,機器學習技術已廣泛使用在樣本處理中。例如,在推薦環境中,可以向用戶提供諸如視頻、文章等的對象。一個用戶可以觀看視頻兩分鐘,并且另一用戶可以觀看視頻五分鐘。可以確定與樣本(包括視頻和用戶數據)有關的標簽,并且標簽可以指示用戶觀看視頻多長時間。已經提出了用于預測標簽的趨勢的解決方案。然而,由于時間長度分布在大范圍之中,并且可能涉及長尾效應,這些解決方案不能輸出精確的預測結果。此時,如何有效地處理樣本并且預測樣本的精確標簽成為熱點。
技術實現思路
1、在本公開的第一方面,提供了一種用于樣本處理的方法。在該方法中,基于多個訓練樣本中的訓練樣本的第一標簽和多個訓練樣本的多個第一標簽,將第一標簽映射到第二標簽,第一標簽和多個第一標簽被表示在第一標簽空間中,并且第二標簽被表示在第二標簽空間中,第二標簽空間小于第一標簽空間。基于第二標簽和訓練樣本,獲得多個分類模型,多個分類模型中的分類模型描述樣本與針對樣本的、被表示在第二標簽空間中的標簽的分類之間的關聯關系。基于多個分類模型生成預測模型,預測模型描述樣本與針對樣本的、被表示在第一標簽空間中的標簽之間的關聯關系。
2、在本公開的第二方面,提供了一種電子設備。該電子設備包括:計算機處理器,該計算機處理器被耦合到計算機可讀存儲單元,該存儲單元包括指令,指令在由該計算機處理器執行時實現根
3、在本公開的第三方面,提供了一種計算機程序產品,該計算機程序產品包括計算機可讀存儲介質,該計算機可讀存儲介質具有隨其實施的程序指令,程序指令可由電子設備執行,以使該電子設備執行根據本公開的第一方面的方法。
4、提供本
技術實現思路
是為了以簡化的形式介紹可供選擇的構思,在下文的具體實施方式中進一步描述這些構思。本
技術實現思路
不旨在標識所要求保護的主題的關鍵特征或必要特征,也不旨在被使用來限制所要求保護的技術方案的范圍。
【技術保護點】
1.一種用于樣本處理的方法,包括:
2.根據權利要求1所述的方法,其中將所述第一標簽映射到所述第二標簽包括:
3.根據權利要求2所述的方法,其中確定所述映射函數包括:
4.根據權利要求3所述的方法,其中確定所述桶函數包括:
5.根據權利要求1所述的方法,其中獲得所述多個分類模型包括:
6.根據權利要求5所述的方法,其中獲得所述多個分類模型包括:針對所述多個分類模型中的所述分類模型,通過訓練初始分類模型來獲得所述分類模型,所述初始分類模型是利用以下來訓練的:訓練樣本以及所述第二標簽是否匹配于所述第二標簽空間中的分類標準的分類。
7.根據權利要求1所述的方法,其中確定所述預測模型包括:
8.根據權利要求7所述的方法,其中生成所述基礎模型包括:基于所述多個分類模型的總和來生成所述預測模型。
9.根據權利要求7所述的方法,還包括:響應于接收到目標樣本,基于所述目標樣本和所述預測模型,確定針對所述目標樣本的在所述第一標簽空間中的目標標簽。
10.根據權利要求9所述的方法,其中基于所述
11.一種電子設備,包括計算機處理器,所述計算機處理器被耦合到計算機可讀存儲器單元,所述存儲器單元包括指令,所述指令在由所述計算機處理器執行時實現用于樣本處理的方法,包括:
12.根據權利要求11所述的設備,其中將所述第一標簽映射到所述第二標簽包括:
13.根據權利要求12所述的設備,其中確定所述映射函數包括:
14.根據權利要求13所述的設備,其中確定所述桶函數包括:
15.根據權利要求11所述的設備,其中獲得所述多個分類模型包括:
16.根據權利要求15所述的設備,其中獲得所述多個分類模型包括:針對所述多個分類模型中的所述分類模型,通過訓練初始分類模型來獲得所述分類模型,所述初始分類模型是利用以下來訓練的:訓練樣本以及所述第二標簽是否匹配于所述第二標簽空間中的分類標準的分類。
17.根據權利要求11所述的設備,其中確定所述預測模型包括:
18.根據權利要求17所述的設備,所述方法還包括:響應于接收到目標樣本,基于所述目標樣本和所述預測模型,確定針對所述目標樣本的在所述第一標簽空間中的目標標簽。
19.根據權利要求18所述的設備,其中基于所述目標樣本和所述預測模型來確定所述目標標簽包括:
20.一種計算機程序產品,所述計算機程序產品包括計算機可讀存儲介質,所述計算機可讀存儲介質具有隨其實施的程序指令,所述程序指令可由電子設備執行,以使所述電子設備執行用于樣本處理的方法,所述方法包括:
...【技術特征摘要】
【國外來華專利技術】
1.一種用于樣本處理的方法,包括:
2.根據權利要求1所述的方法,其中將所述第一標簽映射到所述第二標簽包括:
3.根據權利要求2所述的方法,其中確定所述映射函數包括:
4.根據權利要求3所述的方法,其中確定所述桶函數包括:
5.根據權利要求1所述的方法,其中獲得所述多個分類模型包括:
6.根據權利要求5所述的方法,其中獲得所述多個分類模型包括:針對所述多個分類模型中的所述分類模型,通過訓練初始分類模型來獲得所述分類模型,所述初始分類模型是利用以下來訓練的:訓練樣本以及所述第二標簽是否匹配于所述第二標簽空間中的分類標準的分類。
7.根據權利要求1所述的方法,其中確定所述預測模型包括:
8.根據權利要求7所述的方法,其中生成所述基礎模型包括:基于所述多個分類模型的總和來生成所述預測模型。
9.根據權利要求7所述的方法,還包括:響應于接收到目標樣本,基于所述目標樣本和所述預測模型,確定針對所述目標樣本的在所述第一標簽空間中的目標標簽。
10.根據權利要求9所述的方法,其中基于所述目標樣本和所述預測模型來確定所述目標標簽包括:
11.一種電子設備,包括計算機處理器,所述計算機處理器被耦合到計算機可讀存儲器單元,所述存儲器單元包括指令,所述指令在由所述計算機...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。