【技術實現步驟摘要】
標簽生成模型的訓練方法、裝置、設備、介質及程序產品
[0001]本申請涉及計算機
,尤其涉及一種標簽生成模型的訓練方法、裝置、設備、介質及程序產品。
技術介紹
[0002]人工智能(Artificial Intelligence,AI)是利用數字計算機或者數字計算機控制的機器模擬、延伸和擴展人的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法、技術及應用系統。換句話說,人工智能是計算機科學的一個綜合技術,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器。人工智能也就是研究各種智能機器的設計原理與實現方法,使機器具有感知、推理與決策的功能。
[0003]在相關技術中,對于標簽生成模型的訓練,通常是通過獲取的多個視頻幀樣本直接對標簽生成模型進行訓練,由于多個視頻幀樣本分別所攜帶的標簽內容不同,訓練標簽生成模型的視頻幀樣本的標簽內容分布不均勻,容易產生標簽長尾現象,導致所訓練的標簽生成模型的標簽預測性能不高。
技術實現思路
[0004]本申請實施例提供一種標簽生成模型的訓練方法、裝置、電子設備、計算機可讀存儲介質及計算機程序產品,能夠有效提高所訓練的標簽生成模型的標簽預測性能。
[0005]本申請實施例的技術方案是這樣實現的:
[0006]本申請實施例提供一種標簽生成模型的訓練方法,包括:
[0007]獲取視頻樣本集合,所述視頻樣本集合包括目標視頻的多個視頻幀樣本,各所述視頻幀樣本分別攜帶至少一個樣本標簽,所述多個視頻幀樣本攜帶的 ...
【技術保護點】
【技術特征摘要】
1.一種標簽生成模型的訓練方法,其特征在于,所述方法包括:獲取視頻樣本集合,所述視頻樣本集合包括目標視頻的多個視頻幀樣本,各所述視頻幀樣本分別攜帶至少一個樣本標簽,所述多個視頻幀樣本攜帶的樣本標簽對應不同的標簽內容;將所述視頻樣本集合劃分為第一子集合和第二子集合,其中,所述第一子集合中的視頻幀樣本對應的播放時間點,晚于所述第二子集合中的視頻幀樣本對應的播放時間點;針對不同的各所述標簽內容,確定所述標簽內容對應的視頻幀樣本的采樣數量,所述采樣數量與參考視頻幀樣本的數量負相關,所述參考視頻幀樣本為,所述第一子集合中具有相應所述標簽內容的視頻幀樣本;基于確定的所述采樣數量,從所述第二子集合中,分別選取各所述標簽內容對應的視頻幀樣本作為補充視頻幀樣本;基于所述補充視頻幀樣本和所述第一子集合中的各視頻幀樣本,訓練所述標簽生成模型,所述標簽生成模型,用于基于視頻的多個視頻幀生成所述視頻幀的標簽。2.根據權利要求1所述的方法,其特征在于,所述將所述視頻樣本集合劃分為第一子集合和第二子集合,包括:獲取所述視頻樣本集合中的各所述視頻幀樣本分別對應的播放時間點;將所述視頻樣本集合中播放時間點晚于時間點閾值的視頻幀樣本,確定為第一視頻幀樣本,將所述視頻樣本集合中播放時間點早于時間點閾值的視頻幀樣本,確定為第二視頻幀樣本;將各所述第一視頻幀樣本構成的集合,確定為所述第一子集合,并將各所述第二視頻幀樣本構成的集合,確定為所述第二子集合。3.根據權利要求1所述的方法,其特征在于,所述針對不同的各所述標簽內容,確定所述標簽內容對應的視頻幀樣本的采樣數量,包括:針對不同的各所述標簽內容分別執行以下處理:將所述標簽內容確定為目標標簽內容,并獲取所述第一子集合中所述目標標簽內容對應的所述參考視頻幀樣本的數量;獲取所述第二子集合中所述目標標簽內容對應的至少一個目標視頻幀樣本,并確定所述目標視頻幀樣本的數量,基于所述目標視頻幀樣本的數量,確定參考參數的值;當所述參考參數的值大于或等于1時,將所述參考視頻幀樣本的數量和所述參考參數的值的比值,確定為所述目標標簽內容對應的視頻幀樣本的采樣數量;當所述參考參數的值小于1時,將所述參考視頻幀樣本的數量和所述參考參數的值的乘積,確定為所述目標標簽內容對應的視頻幀樣本的采樣數量。4.根據權利要求3所述的方法,其特征在于,所述基于所述目標視頻幀樣本的數量,確定參考參數的值,包括:統計各所述目標視頻幀樣本對應的其他標簽內容,所述其他標簽內容和所述目標標簽內容為,同一所述目標視頻幀樣本攜帶的不同樣本標簽的標簽內容;基于所述目標視頻幀樣本的數量,確定各所述其他標簽內容的條件概率;將各所述條件概率的加和,確定為所述參考參數的值。5.根據權利要求4所述的方法,其特征在于,所述基于所述目標視頻幀樣本的數量,確
定各所述其他標簽內容的條件概率,包括:針對各所述其他標簽內容分別執行以下處理:在所述目標視頻幀樣本中,統計其他視頻幀樣本的數量,所述其他視頻幀樣本為,攜帶所述其他標簽內容對應的樣本標簽和所述目標標簽內容對應的樣本標簽的目標視頻幀樣本;將所述其他視頻幀樣本的數量和所述目標視頻幀樣本的數量之間的比值,確定為所述其他標簽內容的條件概率。6.根據權利要求1所述的方法,其特征在于,所述基于確定的所述采樣數量,從所述第二子集合中,分別選取各所述標簽內容對應的視頻幀樣本作為補充視頻幀樣本,包括:針對不同的各所述標簽內容分別執行以下處理:將所述第二子集合中所述標簽內容對應的各視頻幀樣本,確定為候選視頻幀樣本;確定各所述候選視頻幀樣本的參考參數的值,并按照所述參考參數的值從高至低的順序,依次選取相應的所述采樣數量的候選視頻幀樣本,作為所述補充視頻幀樣本。7.根據權利要求6所述的方法,其特征在于,所述確定各所述候選視頻幀樣本的參考參數的值,包括:針對各所述候選視頻幀樣本分別執行以下處理:獲取所述候選視頻幀樣本具有的各所述標簽內容的參考參數的值;將各所述標簽內容的參考參數的值的乘積,確定為所述候選視頻幀樣本的參考參數的值。8.根據權利要求1所述的方法,其特征在于,所述基于所述補充視頻幀樣本和所述第一子集合中的各視頻幀樣本,訓練所述標簽生成模型,包括:調用所述標簽生成模型,對所述補充視頻幀樣本進行標簽預測,得到所述補充視頻幀樣本的...
【專利技術屬性】
技術研發人員:李明達,
申請(專利權)人:騰訊科技深圳有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。