System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本申請涉及計算機,尤其涉及一種標(biāo)簽生成方法、裝置、電子設(shè)備及存儲介質(zhì)。
技術(shù)介紹
1、視頻平臺在分發(fā)長視頻的流程之中,更好的長視頻內(nèi)容理解可以幫助推薦系統(tǒng)更好個性化的分發(fā)內(nèi)容。主流的內(nèi)容平臺會通過內(nèi)容標(biāo)簽來將內(nèi)容進行多個維度的分類,精準(zhǔn)的標(biāo)簽代表著對于內(nèi)容更精準(zhǔn)的理解。
2、目前,在長視頻平臺中,內(nèi)容的標(biāo)簽主要通過專業(yè)的頻道人工編輯在內(nèi)容管理平臺給相關(guān)的內(nèi)容打標(biāo)簽,無法通過機器來實現(xiàn),耗費大量的人力,效率非常低,且由于不同人對同一內(nèi)容打的標(biāo)簽可能不同,導(dǎo)致視頻內(nèi)容的標(biāo)簽準(zhǔn)確率和一致性較低。
技術(shù)實現(xiàn)思路
1、為了解決上述技術(shù)問題或者至少部分地解決上述技術(shù)問題,本申請?zhí)峁┝艘环N標(biāo)簽生成方法、裝置、電子設(shè)備及存儲介質(zhì)。
2、第一方面,本申請?zhí)峁┝艘环N標(biāo)簽生成方法,包括:
3、獲取目標(biāo)視頻的視頻標(biāo)識和描述數(shù)據(jù);
4、根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù);
5、基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合;
6、將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽。
7、可選地,根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù),包括:
8、根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的屬性數(shù)據(jù)和編目數(shù)據(jù);
9、獲取站內(nèi)圖譜數(shù)據(jù);
10、根據(jù)所述視頻標(biāo)識獲取與所述目標(biāo)視頻關(guān)聯(lián)的站外數(shù)據(jù);
11、將所述屬性數(shù)據(jù)、所述編目數(shù)據(jù)、所述站內(nèi)圖譜
12、可選地,基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合,包括:
13、對所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)進行去除人名處理,得到第一中間數(shù)據(jù);
14、將所述第一中間數(shù)據(jù)進行分詞處理,得到第二中間數(shù)據(jù);
15、將所述第二中間數(shù)據(jù)中的詞語進行打分處理,得到第三中間數(shù)據(jù);
16、對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合。
17、可選地,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:
18、對所述第三中間數(shù)據(jù)進行黑名單過濾,過濾掉黑名單內(nèi)的詞語,得到第四中間數(shù)據(jù);
19、調(diào)整所述第四中間數(shù)據(jù)中符合條件的詞語的分數(shù),得到第五中間數(shù)據(jù);
20、對所述第五中間數(shù)據(jù)與預(yù)設(shè)標(biāo)簽體系匹配,得到分類標(biāo)簽集合和文本標(biāo)簽集合;
21、將所述分類標(biāo)簽集合中的前第一預(yù)設(shè)數(shù)量個分類標(biāo)簽及所述文本標(biāo)簽集合中的前第二預(yù)設(shè)數(shù)量個文本標(biāo)簽確定為所述候選標(biāo)簽集合。
22、可選地,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:
23、確定所述目標(biāo)視頻的類型;
24、若所述目標(biāo)視頻為第一類型,基于所述描述數(shù)據(jù)生成多維度標(biāo)簽;
25、將所述后處理得到的標(biāo)簽及所述多維度標(biāo)簽確定為候選標(biāo)簽集合。
26、可選地,將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽,包括:
27、基于所述候選標(biāo)簽集合確定候選標(biāo)簽;
28、所述描述數(shù)據(jù)及所述候選標(biāo)簽輸入大模型,以使大模型輸出所述目標(biāo)視頻的分類標(biāo)簽。
29、可選地,基于所述候選標(biāo)簽集合確定候選標(biāo)簽,包括:
30、在所述候選標(biāo)簽集合中確定分類標(biāo)簽;
31、將所述分類標(biāo)簽中維度為類型的標(biāo)簽確定為候選標(biāo)簽。
32、第二方面,本申請?zhí)峁┝艘环N標(biāo)簽生成裝置,包括:
33、第一獲取模塊,用于獲取目標(biāo)視頻的視頻標(biāo)識和描述數(shù)據(jù);
34、第二獲取模塊,用于根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù);
35、生成模塊,用于基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合;
36、輸入模塊,用于將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽。
37、可選地,所述第二獲取模塊包括:
38、第一獲取單元,用于根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的屬性數(shù)據(jù)和編目數(shù)據(jù);
39、第二獲取單元,用于獲取站內(nèi)圖譜數(shù)據(jù);
40、第三獲取單元,用于根據(jù)所述視頻標(biāo)識獲取與所述目標(biāo)視頻關(guān)聯(lián)的站外數(shù)據(jù);
41、第一確定單元,用于將所述屬性數(shù)據(jù)、所述編目數(shù)據(jù)、所述站內(nèi)圖譜數(shù)據(jù)及所述站外數(shù)據(jù)確定為所述分類參考數(shù)據(jù)。
42、可選地,所述生成模塊包括:
43、第一處理單元,用于對所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)進行去除人名處理,得到第一中間數(shù)據(jù);
44、第二處理單元,用于將所述第一中間數(shù)據(jù)進行分詞處理,得到第二中間數(shù)據(jù);
45、第三處理單元,用于將所述第二中間數(shù)據(jù)中的詞語進行打分處理,得到第三中間數(shù)據(jù);
46、對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,用于對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合。
47、可選地,所述第四處理單元包括:
48、過濾子單元,用于對所述第三中間數(shù)據(jù)進行黑名單過濾,過濾掉黑名單內(nèi)的詞語,得到第四中間數(shù)據(jù);
49、調(diào)整子單元,用于調(diào)整所述第四中間數(shù)據(jù)中符合條件的詞語的分數(shù),得到第五中間數(shù)據(jù);
50、匹配子單元,用于對所述第五中間數(shù)據(jù)與預(yù)設(shè)標(biāo)簽體系匹配,得到分類標(biāo)簽集合和文本標(biāo)簽集合;
51、第一確定子單元,用于將所述分類標(biāo)簽集合中的前第一預(yù)設(shè)數(shù)量個分類標(biāo)簽及所述文本標(biāo)簽集合中的前第二預(yù)設(shè)數(shù)量個文本標(biāo)簽確定為所述候選標(biāo)簽集合。
52、可選地,所述第四處理單元包括:
53、第二確定子單元,用于確定所述目標(biāo)視頻的類型;
54、生成子單元,用于若所述目標(biāo)視頻為第一類型,基于所述描述數(shù)據(jù)生成多維度標(biāo)簽;
55、第三確定子單元,用于將所述后處理得到的標(biāo)簽及所述多維度標(biāo)簽確定為候選標(biāo)簽集合。
56、可選地,所述輸入模塊包括:
57、第二確定單元,用于基于所述候選標(biāo)簽集合確定候選標(biāo)簽;
58、輸入單元,用于所述描述數(shù)據(jù)及所述候選標(biāo)簽輸入大模型,以使大模型輸出所述目標(biāo)視頻的分類標(biāo)簽。
59、可選地,所述第二確定單元包括:
60、第四確定子單元,用于在所述候選標(biāo)簽集合中確定分類標(biāo)簽;
61、第五確定子單元,用于將所述分類標(biāo)簽中維度為類型的標(biāo)簽確定為候選標(biāo)簽。
62、第三方面,本申請?zhí)峁┝艘环N電子設(shè)備,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
63、存儲器,用于存放計算機程序;
64、處理器,用于執(zhí)行存儲器上所存放的程序時,實現(xiàn)第一方面任一所述的標(biāo)簽生成方法。
65、第四方面,本申請?zhí)峁┝艘环N計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種標(biāo)簽生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù),包括:
3.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合,包括:
4.根據(jù)權(quán)利要求3所述的標(biāo)簽生成方法,其特征在于,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:
5.根據(jù)權(quán)利要求3所述的標(biāo)簽生成方法,其特征在于,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:
6.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,將所述描述數(shù)據(jù)及所述候選標(biāo)簽集合輸入預(yù)設(shè)分類模型,得到所述目標(biāo)視頻的分類標(biāo)簽,包括:
7.根據(jù)權(quán)利要求6所述的標(biāo)簽生成方法,其特征在于,基于所述候選標(biāo)簽集合確定候選標(biāo)簽,包括:
8.一種標(biāo)簽生成裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
10.
...【技術(shù)特征摘要】
1.一種標(biāo)簽生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,根據(jù)所述視頻標(biāo)識獲取所述目標(biāo)視頻的分類參考數(shù)據(jù),包括:
3.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征在于,基于所述描述數(shù)據(jù)及所述分類參考數(shù)據(jù)生成候選標(biāo)簽集合,包括:
4.根據(jù)權(quán)利要求3所述的標(biāo)簽生成方法,其特征在于,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:
5.根據(jù)權(quán)利要求3所述的標(biāo)簽生成方法,其特征在于,對所述第三中間數(shù)據(jù)進行后處理,得到所述候選標(biāo)簽集合,包括:
6.根據(jù)權(quán)利要求1所述的標(biāo)簽生成方法,其特征...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:程啟健,張嘉文,
申請(專利權(quán))人:北京愛奇藝科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。