System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲AV成人片无码网站,亚洲av中文无码字幕色不卡,久久久久无码精品国产不卡
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    標(biāo)簽生成方法、裝置、電子設(shè)備及存儲介質(zhì)制造方法及圖紙

    技術(shù)編號:44429246 閱讀:4 留言:0更新日期:2025-02-28 18:42
    本發(fā)明專利技術(shù)涉及一種標(biāo)簽生成方法、裝置、電子設(shè)備及存儲介質(zhì),其中,標(biāo)簽生成方法包括:獲取目標(biāo)視頻的視頻標(biāo)識和描述數(shù)據(jù);根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù);基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合;將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽。本申請實施例能夠自動生成目標(biāo)視頻的分類標(biāo)簽,并且,進一步的,通過在擴充后更豐富的候選標(biāo)簽集合中選擇出更接近目標(biāo)視頻的描述數(shù)據(jù)的分類標(biāo)簽,提升標(biāo)簽生成的準(zhǔn)確率,而且,由于是基于相同標(biāo)準(zhǔn)生成分類標(biāo)簽,避免人工打標(biāo)簽因個體差異帶來的誤差,提高標(biāo)簽的一致性。

    【技術(shù)實現(xiàn)步驟摘要】

    本申請涉及計算機,尤其涉及一種標(biāo)簽生成方法、裝置、電子設(shè)備及存儲介質(zhì)


    技術(shù)介紹

    1、視頻平臺在分發(fā)長視頻的流程之中,更好的長視頻內(nèi)容理解可以幫助推薦系統(tǒng)更好個性化的分發(fā)內(nèi)容。主流的內(nèi)容平臺會通過內(nèi)容標(biāo)簽來將內(nèi)容進行多個維度的分類,精準(zhǔn)的標(biāo)簽代表著對于內(nèi)容更精準(zhǔn)的理解。

    2、目前,在長視頻平臺中,內(nèi)容的標(biāo)簽主要通過專業(yè)的頻道人工編輯在內(nèi)容管理平臺給相關(guān)的內(nèi)容打標(biāo)簽,無法通過機器來實現(xiàn),耗費大量的人力,效率非常低,且由于不同人對同一內(nèi)容打的標(biāo)簽可能不同,導(dǎo)致視頻內(nèi)容的標(biāo)簽準(zhǔn)確率和一致性較低。


    技術(shù)實現(xiàn)思路

    1、為了解決上述技術(shù)問題或者至少部分地解決上述技術(shù)問題,本申請?zhí)峁┝艘环N標(biāo)簽生成方法、裝置、電子設(shè)備及存儲介質(zhì)。

    2、第一方面,本申請?zhí)峁┝艘环N標(biāo)簽生成方法,包括:

    3、獲取目標(biāo)視頻的視頻標(biāo)識和描述數(shù)據(jù);

    4、根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù);

    5、基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合;

    6、將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽。

    7、可選地,根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù),包括:

    8、根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的屬性數(shù)據(jù)和編目數(shù)據(jù);

    9、獲取站內(nèi)圖譜數(shù)據(jù);

    10、根據(jù)所述視頻標(biāo)識獲取與所述目標(biāo)視頻關(guān)聯(lián)的站外數(shù)據(jù);

    11、將所述屬性數(shù)據(jù)、所述編目數(shù)據(jù)、所述站內(nèi)圖譜數(shù)據(jù)及所述站外數(shù)據(jù)確定為所述分類參考數(shù)據(jù)。

    12、可選地,基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合,包括:

    13、對所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)進行去除人名處理,得到第一中間數(shù)據(jù);

    14、將所述第一中間數(shù)據(jù)進行分詞處理,得到第二中間數(shù)據(jù);

    15、將所述第二中間數(shù)據(jù)中的詞語進行打分處理,得到第三中間數(shù)據(jù);

    16、對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合。

    17、可選地,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:

    18、對所述第三中間數(shù)據(jù)進行黑名單過濾,過濾掉黑名單內(nèi)的詞語,得到第四中間數(shù)據(jù);

    19、調(diào)整所述第四中間數(shù)據(jù)中符合條件的詞語的分數(shù),得到第五中間數(shù)據(jù);

    20、對所述第五中間數(shù)據(jù)與預(yù)設(shè)標(biāo)簽體系匹配,得到分類標(biāo)簽集合和文本標(biāo)簽集合;

    21、將所述分類標(biāo)簽集合中的前第一預(yù)設(shè)數(shù)量個分類標(biāo)簽及所述文本標(biāo)簽集合中的前第二預(yù)設(shè)數(shù)量個文本標(biāo)簽確定為所述候選標(biāo)簽集合。

    22、可選地,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:

    23、確定所述目標(biāo)視頻的類型;

    24、若所述目標(biāo)視頻為第一類型,基于所述描述數(shù)據(jù)生成多維度標(biāo)簽;

    25、將所述后處理得到的標(biāo)簽及所述多維度標(biāo)簽確定為候選標(biāo)簽集合。

    26、可選地,將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽,包括:

    27、基于所述候選標(biāo)簽集合確定候選標(biāo)簽;

    28、所述描述數(shù)據(jù)及所述候選標(biāo)簽輸入大模型,以使大模型輸出所述目標(biāo)視頻的分類標(biāo)簽。

    29、可選地,基于所述候選標(biāo)簽集合確定候選標(biāo)簽,包括:

    30、在所述候選標(biāo)簽集合中確定分類標(biāo)簽;

    31、將所述分類標(biāo)簽中維度為類型的標(biāo)簽確定為候選標(biāo)簽。

    32、第二方面,本申請?zhí)峁┝艘环N標(biāo)簽生成裝置,包括:

    33、第一獲取模塊,用于獲取目標(biāo)視頻的視頻標(biāo)識和描述數(shù)據(jù);

    34、第二獲取模塊,用于根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù);

    35、生成模塊,用于基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合;

    36、輸入模塊,用于將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽。

    37、可選地,所述第二獲取模塊包括:

    38、第一獲取單元,用于根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的屬性數(shù)據(jù)和編目數(shù)據(jù);

    39、第二獲取單元,用于獲取站內(nèi)圖譜數(shù)據(jù);

    40、第三獲取單元,用于根據(jù)所述視頻標(biāo)識獲取與所述目標(biāo)視頻關(guān)聯(lián)的站外數(shù)據(jù);

    41、第一確定單元,用于將所述屬性數(shù)據(jù)、所述編目數(shù)據(jù)、所述站內(nèi)圖譜數(shù)據(jù)及所述站外數(shù)據(jù)確定為所述分類參考數(shù)據(jù)。

    42、可選地,所述生成模塊包括:

    43、第一處理單元,用于對所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)進行去除人名處理,得到第一中間數(shù)據(jù);

    44、第二處理單元,用于將所述第一中間數(shù)據(jù)進行分詞處理,得到第二中間數(shù)據(jù);

    45、第三處理單元,用于將所述第二中間數(shù)據(jù)中的詞語進行打分處理,得到第三中間數(shù)據(jù);

    46、對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,用于對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合。

    47、可選地,所述第四處理單元包括:

    48、過濾子單元,用于對所述第三中間數(shù)據(jù)進行黑名單過濾,過濾掉黑名單內(nèi)的詞語,得到第四中間數(shù)據(jù);

    49、調(diào)整子單元,用于調(diào)整所述第四中間數(shù)據(jù)中符合條件的詞語的分數(shù),得到第五中間數(shù)據(jù);

    50、匹配子單元,用于對所述第五中間數(shù)據(jù)與預(yù)設(shè)標(biāo)簽體系匹配,得到分類標(biāo)簽集合和文本標(biāo)簽集合;

    51、第一確定子單元,用于將所述分類標(biāo)簽集合中的前第一預(yù)設(shè)數(shù)量個分類標(biāo)簽及所述文本標(biāo)簽集合中的前第二預(yù)設(shè)數(shù)量個文本標(biāo)簽確定為所述候選標(biāo)簽集合。

    52、可選地,所述第四處理單元包括:

    53、第二確定子單元,用于確定所述目標(biāo)視頻的類型;

    54、生成子單元,用于若所述目標(biāo)視頻為第一類型,基于所述描述數(shù)據(jù)生成多維度標(biāo)簽;

    55、第三確定子單元,用于將所述后處理得到的標(biāo)簽及所述多維度標(biāo)簽確定為候選標(biāo)簽集合。

    56、可選地,所述輸入模塊包括:

    57、第二確定單元,用于基于所述候選標(biāo)簽集合確定候選標(biāo)簽;

    58、輸入單元,用于所述描述數(shù)據(jù)及所述候選標(biāo)簽輸入大模型,以使大模型輸出所述目標(biāo)視頻的分類標(biāo)簽。

    59、可選地,所述第二確定單元包括:

    60、第四確定子單元,用于在所述候選標(biāo)簽集合中確定分類標(biāo)簽;

    61、第五確定子單元,用于將所述分類標(biāo)簽中維度為類型的標(biāo)簽確定為候選標(biāo)簽。

    62、第三方面,本申請?zhí)峁┝艘环N電子設(shè)備,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;

    63、存儲器,用于存放計算機程序;

    64、處理器,用于執(zhí)行存儲器上所存放的程序時,實現(xiàn)第一方面任一所述的標(biāo)簽生成方法。

    65、第四方面,本申請?zhí)峁┝艘环N計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種標(biāo)簽生成方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù),包括:

    3.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合,包括:

    4.根據(jù)權(quán)利要求3所述的標(biāo)簽生成方法,其特征在于,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:

    5.根據(jù)權(quán)利要求3所述的標(biāo)簽生成方法,其特征在于,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:

    6.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽,包括:

    7.根據(jù)權(quán)利要求6所述的標(biāo)簽生成方法,其特征在于,基于所述候選標(biāo)簽集合確定候選標(biāo)簽,包括:

    8.一種標(biāo)簽生成裝置,其特征在于,包括:

    9.一種電子設(shè)備,其特征在于,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;

    10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有標(biāo)簽生成方法的程序,所述標(biāo)簽生成方法的程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-7任一所述的標(biāo)簽生成方法的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種標(biāo)簽生成方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù),包括:

    3.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合,包括:

    4.根據(jù)權(quán)利要求3所述的標(biāo)簽生成方法,其特征在于,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:

    5.根據(jù)權(quán)利要求3所述的標(biāo)簽生成方法,其特征在于,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:

    6.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:程啟健張嘉文
    申請(專利權(quán))人:北京愛奇藝科技有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 精品无码一区二区三区爱欲九九 | 精品久久久久久无码不卡| 曰韩无码二三区中文字幕| 国产成人无码精品久久久露脸 | 无码人妻丰满熟妇区五十路| 精品人妻系列无码人妻免费视频| 无码H肉动漫在线观看| 亚欧无码精品无码有性视频| 亚洲色av性色在线观无码| 国产精品无码永久免费888| 午夜爽喷水无码成人18禁三级| 国产AV无码专区亚洲Av| 国产成人无码A区在线观看导航| 无码孕妇孕交在线观看| 在线高清无码A.| 亚洲v国产v天堂a无码久久| 久久人午夜亚洲精品无码区| 亚洲av无码不卡久久| 无码AV天堂一区二区三区| 久久亚洲精品无码播放| 一本大道无码人妻精品专区| 无码永久免费AV网站| 亚洲成av人无码亚洲成av人| 亚洲一区二区三区国产精品无码| 国产Av激情久久无码天堂| 2014AV天堂无码一区| 日韩av无码免费播放| 中文无码伦av中文字幕| 国产成人无码AV一区二区 | 一区二区三区无码高清视频| 亚洲精品无码专区| 亚洲国产精品无码久久| 精品久久久久久无码中文字幕一区 | 精品无码人妻一区二区三区| 无码国产精品一区二区免费3p| 久久久无码精品亚洲日韩蜜桃| 国产在线无码一区二区三区视频 | 亚洲av中文无码字幕色不卡| 亚洲午夜无码毛片av久久京东热| 亚洲视频无码高清在线| 成人无码区免费视频观看|