• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    標簽生成模型的訓練方法、裝置、設備、介質及程序產品制造方法及圖紙

    技術編號:39271342 閱讀:15 留言:0更新日期:2023-11-07 10:50
    本申請提供了一種標簽生成模型的訓練方法、裝置、設備、介質及程序產品;方法包括:獲取視頻樣本集合;將視頻樣本集合劃分為第一子集合和第二子集合;針對不同的各標簽內容,確定標簽內容對應的視頻幀樣本的采樣數量;基于確定的采樣數量,從第二子集合中,分別選取各標簽內容對應的視頻幀樣本作為補充視頻幀樣本;基于補充視頻幀樣本和第一子集合中的各視頻幀樣本,訓練標簽生成模型,標簽生成模型,用于基于視頻的多個視頻幀生成視頻幀的標簽。通過本申請,能夠有效提高所訓練的標簽生成模型的標簽預測性能。標簽預測性能。標簽預測性能。

    【技術實現步驟摘要】
    標簽生成模型的訓練方法、裝置、設備、介質及程序產品


    [0001]本申請涉及計算機
    ,尤其涉及一種標簽生成模型的訓練方法、裝置、設備、介質及程序產品。

    技術介紹

    [0002]人工智能(Artificial Intelligence,AI)是利用數字計算機或者數字計算機控制的機器模擬、延伸和擴展人的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法、技術及應用系統。換句話說,人工智能是計算機科學的一個綜合技術,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器。人工智能也就是研究各種智能機器的設計原理與實現方法,使機器具有感知、推理與決策的功能。
    [0003]在相關技術中,對于標簽生成模型的訓練,通常是通過獲取的多個視頻幀樣本直接對標簽生成模型進行訓練,由于多個視頻幀樣本分別所攜帶的標簽內容不同,訓練標簽生成模型的視頻幀樣本的標簽內容分布不均勻,容易產生標簽長尾現象,導致所訓練的標簽生成模型的標簽預測性能不高。

    技術實現思路

    [0004]本申請實施例提供一種標簽生成模型的訓練方法、裝置、電子設備、計算機可讀存儲介質及計算機程序產品,能夠有效提高所訓練的標簽生成模型的標簽預測性能。
    [0005]本申請實施例的技術方案是這樣實現的:
    [0006]本申請實施例提供一種標簽生成模型的訓練方法,包括:
    [0007]獲取視頻樣本集合,所述視頻樣本集合包括目標視頻的多個視頻幀樣本,各所述視頻幀樣本分別攜帶至少一個樣本標簽,所述多個視頻幀樣本攜帶的樣本標簽對應不同的標簽內容;
    [0008]將所述視頻樣本集合劃分為第一子集合和第二子集合,其中,所述第一子集合中的視頻幀樣本對應的播放時間點,晚于所述第二子集合中的視頻幀樣本對應的播放時間點;
    [0009]針對不同的各所述標簽內容,確定所述標簽內容對應的視頻幀樣本的采樣數量,所述采樣數量與參考視頻幀樣本的數量負相關,所述參考視頻幀樣本為,所述第一子集合中具有相應所述標簽內容的視頻幀樣本;
    [0010]基于確定的所述采樣數量,從所述第二子集合中,分別選取各所述標簽內容對應的視頻幀樣本作為補充視頻幀樣本;
    [0011]基于所述補充視頻幀樣本和所述第一子集合中的各視頻幀樣本,訓練所述標簽生成模型,所述標簽生成模型,用于基于視頻的多個視頻幀生成所述視頻幀的標簽。
    [0012]本申請實施例提供一種標簽生成模型的訓練裝置,包括:
    [0013]獲取模塊,用于獲取視頻樣本集合,所述視頻樣本集合包括目標視頻的多個視頻幀樣本,各所述視頻幀樣本分別攜帶至少一個樣本標簽,所述多個視頻幀樣本攜帶的樣本
    標簽對應不同的標簽內容;
    [0014]劃分模塊,用于將所述視頻樣本集合劃分為第一子集合和第二子集合,其中,所述第一子集合中的視頻幀樣本對應的播放時間點,晚于所述第二子集合中的視頻幀樣本對應的播放時間點;
    [0015]數量確定模塊,用于針對不同的各所述標簽內容,確定所述標簽內容對應的視頻幀樣本的采樣數量,所述采樣數量與參考視頻幀樣本的數量負相關,所述參考視頻幀樣本為,所述第一子集合中具有相應所述標簽內容的視頻幀樣本;
    [0016]選取模塊,用于基于確定的所述采樣數量,從所述第二子集合中,分別選取各所述標簽內容對應的視頻幀樣本作為補充視頻幀樣本;
    [0017]訓練模塊,用于基于所述補充視頻幀樣本和所述第一子集合中的各視頻幀樣本,訓練所述標簽生成模型,所述標簽生成模型,用于基于視頻的多個視頻幀生成所述視頻幀的標簽。
    [0018]上述方案中,上述劃分模塊,還用于獲取所述視頻樣本集合中的各所述視頻幀樣本分別對應的播放時間點;將所述視頻樣本集合中播放時間點晚于時間點閾值的視頻幀樣本,確定為第一視頻幀樣本,將所述視頻樣本集合中播放時間點早于時間點閾值的視頻幀樣本,確定為第二視頻幀樣本;將各所述第一視頻幀樣本構成的集合,確定為所述第一子集合,并將各所述第二視頻幀樣本構成的集合,確定為所述第二子集合。
    [0019]上述方案中,上述數量確定模塊,還用于針對不同的各所述標簽內容分別執行以下處理:將所述標簽內容確定為目標標簽內容,并獲取所述第一子集合中所述目標標簽內容對應的所述參考視頻幀樣本的數量;獲取所述第二子集合中所述目標標簽內容對應的至少一個目標視頻幀樣本,并確定所述目標視頻幀樣本的數量,基于所述目標視頻幀樣本的數量,確定參考參數的值;當所述參考參數的值大于或等于1時,將所述參考視頻幀樣本的數量和所述參考參數的值的比值,確定為所述目標標簽內容對應的視頻幀樣本的采樣數量;當所述參考參數的值小于1時,將所述參考視頻幀樣本的數量和所述參考參數的值的乘積,確定為所述目標標簽內容對應的視頻幀樣本的采樣數量。
    [0020]上述方案中,上述數量確定模塊,還用于統計各所述目標視頻幀樣本對應的其他標簽內容,所述其他標簽內容和所述目標標簽內容為,同一所述目標視頻幀樣本攜帶的不同樣本標簽的標簽內容;基于所述目標視頻幀樣本的數量,確定各所述其他標簽內容的條件概率;將各所述條件概率的加和,確定為所述參考參數的值。
    [0021]上述方案中,上述數量確定模塊,還用于針對各所述其他標簽內容分別執行以下處理:在所述目標視頻幀樣本中,統計其他視頻幀樣本的數量,所述其他視頻幀樣本為,攜帶所述其他標簽內容對應的樣本標簽和所述目標標簽內容對應的樣本標簽的目標視頻幀樣本;將所述其他視頻幀樣本的數量和所述目標視頻幀樣本的數量之間的比值,確定為所述其他標簽內容的條件概率。
    [0022]上述方案中,上述選取模塊,還用于針對不同的各所述標簽內容分別執行以下處理:將所述第二子集合中所述標簽內容對應的各視頻幀樣本,確定為候選視頻幀樣本;確定各所述候選視頻幀樣本的參考參數的值,并按照所述參考參數的值從高至低的順序,依次選取相應的所述采樣數量的候選視頻幀樣本,作為所述補充視頻幀樣本。
    [0023]上述方案中,上述選取模塊,還用于針對各所述候選視頻幀樣本分別執行以下處
    理:獲取所述候選視頻幀樣本具有的各所述標簽內容的參考參數的值;將各所述標簽內容的參考參數的值的乘積,確定為所述候選視頻幀樣本的參考參數的值。
    [0024]上述方案中,上述訓練模塊,還用于調用所述標簽生成模型,對所述補充視頻幀樣本進行標簽預測,得到所述補充視頻幀樣本的第一預測概率,所述第一預測概率,用于指示所述補充視頻幀樣本的預測標簽為相應的所述樣本標簽的概率;基于所述第一預測概率,確定所述標簽生成模型的第一損失值;調用所述標簽生成模型,對所述第一子集合中的各視頻幀樣本分別進行標簽預測,得到各所述視頻幀樣本的第二預測概率,所述第二預測概率,用于指示所述視頻幀樣本的預測標簽為相應的所述樣本標簽的概率;基于各所述第二預測概率,確定各所述第二預測概率對應的第二損失值;將所述第一損失值和各所述第二損失值進行加權求和,得到求和損失值,基于所述求和損失值,更新所述標簽生成模型的模型參數。
    [0025]上述方案中,上述訓練模塊,還用于確本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種標簽生成模型的訓練方法,其特征在于,所述方法包括:獲取視頻樣本集合,所述視頻樣本集合包括目標視頻的多個視頻幀樣本,各所述視頻幀樣本分別攜帶至少一個樣本標簽,所述多個視頻幀樣本攜帶的樣本標簽對應不同的標簽內容;將所述視頻樣本集合劃分為第一子集合和第二子集合,其中,所述第一子集合中的視頻幀樣本對應的播放時間點,晚于所述第二子集合中的視頻幀樣本對應的播放時間點;針對不同的各所述標簽內容,確定所述標簽內容對應的視頻幀樣本的采樣數量,所述采樣數量與參考視頻幀樣本的數量負相關,所述參考視頻幀樣本為,所述第一子集合中具有相應所述標簽內容的視頻幀樣本;基于確定的所述采樣數量,從所述第二子集合中,分別選取各所述標簽內容對應的視頻幀樣本作為補充視頻幀樣本;基于所述補充視頻幀樣本和所述第一子集合中的各視頻幀樣本,訓練所述標簽生成模型,所述標簽生成模型,用于基于視頻的多個視頻幀生成所述視頻幀的標簽。2.根據權利要求1所述的方法,其特征在于,所述將所述視頻樣本集合劃分為第一子集合和第二子集合,包括:獲取所述視頻樣本集合中的各所述視頻幀樣本分別對應的播放時間點;將所述視頻樣本集合中播放時間點晚于時間點閾值的視頻幀樣本,確定為第一視頻幀樣本,將所述視頻樣本集合中播放時間點早于時間點閾值的視頻幀樣本,確定為第二視頻幀樣本;將各所述第一視頻幀樣本構成的集合,確定為所述第一子集合,并將各所述第二視頻幀樣本構成的集合,確定為所述第二子集合。3.根據權利要求1所述的方法,其特征在于,所述針對不同的各所述標簽內容,確定所述標簽內容對應的視頻幀樣本的采樣數量,包括:針對不同的各所述標簽內容分別執行以下處理:將所述標簽內容確定為目標標簽內容,并獲取所述第一子集合中所述目標標簽內容對應的所述參考視頻幀樣本的數量;獲取所述第二子集合中所述目標標簽內容對應的至少一個目標視頻幀樣本,并確定所述目標視頻幀樣本的數量,基于所述目標視頻幀樣本的數量,確定參考參數的值;當所述參考參數的值大于或等于1時,將所述參考視頻幀樣本的數量和所述參考參數的值的比值,確定為所述目標標簽內容對應的視頻幀樣本的采樣數量;當所述參考參數的值小于1時,將所述參考視頻幀樣本的數量和所述參考參數的值的乘積,確定為所述目標標簽內容對應的視頻幀樣本的采樣數量。4.根據權利要求3所述的方法,其特征在于,所述基于所述目標視頻幀樣本的數量,確定參考參數的值,包括:統計各所述目標視頻幀樣本對應的其他標簽內容,所述其他標簽內容和所述目標標簽內容為,同一所述目標視頻幀樣本攜帶的不同樣本標簽的標簽內容;基于所述目標視頻幀樣本的數量,確定各所述其他標簽內容的條件概率;將各所述條件概率的加和,確定為所述參考參數的值。5.根據權利要求4所述的方法,其特征在于,所述基于所述目標視頻幀樣本的數量,確
    定各所述其他標簽內容的條件概率,包括:針對各所述其他標簽內容分別執行以下處理:在所述目標視頻幀樣本中,統計其他視頻幀樣本的數量,所述其他視頻幀樣本為,攜帶所述其他標簽內容對應的樣本標簽和所述目標標簽內容對應的樣本標簽的目標視頻幀樣本;將所述其他視頻幀樣本的數量和所述目標視頻幀樣本的數量之間的比值,確定為所述其他標簽內容的條件概率。6.根據權利要求1所述的方法,其特征在于,所述基于確定的所述采樣數量,從所述第二子集合中,分別選取各所述標簽內容對應的視頻幀樣本作為補充視頻幀樣本,包括:針對不同的各所述標簽內容分別執行以下處理:將所述第二子集合中所述標簽內容對應的各視頻幀樣本,確定為候選視頻幀樣本;確定各所述候選視頻幀樣本的參考參數的值,并按照所述參考參數的值從高至低的順序,依次選取相應的所述采樣數量的候選視頻幀樣本,作為所述補充視頻幀樣本。7.根據權利要求6所述的方法,其特征在于,所述確定各所述候選視頻幀樣本的參考參數的值,包括:針對各所述候選視頻幀樣本分別執行以下處理:獲取所述候選視頻幀樣本具有的各所述標簽內容的參考參數的值;將各所述標簽內容的參考參數的值的乘積,確定為所述候選視頻幀樣本的參考參數的值。8.根據權利要求1所述的方法,其特征在于,所述基于所述補充視頻幀樣本和所述第一子集合中的各視頻幀樣本,訓練所述標簽生成模型,包括:調用所述標簽生成模型,對所述補充視頻幀樣本進行標簽預測,得到所述補充視頻幀樣本的...

    【專利技術屬性】
    技術研發人員:李明達
    申請(專利權)人:騰訊科技深圳有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 免费A级毛片无码A| 全免费a级毛片免费看无码| 亚洲欧洲无码一区二区三区| HEYZO无码综合国产精品| 无码精品黑人一区二区三区| 久久午夜伦鲁片免费无码| 久久久久无码精品国产h动漫| 亚洲熟妇无码av另类vr影视| 日韩一区二区三区无码影院| 无码人妻AV一二区二区三区| 无码八A片人妻少妇久久| 国产成年无码久久久久下载| 亚洲AV无码一区二区三区性色| 无码视频在线播放一二三区| 亚洲AV永久纯肉无码精品动漫| 国产综合无码一区二区色蜜蜜| 亚洲Av综合色区无码专区桃色| 精品人妻无码专区在中文字幕| 免费A级毛片无码视频| 国产99久久九九精品无码| 无码毛片AAA在线| 亚洲ⅴ国产v天堂a无码二区| 中文字幕无码毛片免费看| 亚洲国产av无码精品| 无码av不卡一区二区三区| 亚洲国产成人无码AV在线影院| 久久久久亚洲精品无码系列| 中文字幕人妻无码一夲道| 国产乱子伦精品免费无码专区| 人妻无码一区二区视频| 夫妻免费无码V看片| 亚洲高清无码专区视频| 亚洲精品无码日韩国产不卡?V| 中文无码vs无码人妻| 国产成人A人亚洲精品无码| 曰批全过程免费视频在线观看无码| 台湾无码AV一区二区三区| 无码人妻精品一区二区三| 影音先锋无码a∨男人资源站| 国产精品热久久无码av| 色欲狠狠躁天天躁无码中文字幕|