System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及文本匹配,尤其涉及一種媒資匹配方法和計算機設備。
技術介紹
1、在當今數字娛樂時代,隨著iptv(internet?protocol?television)業務的快速發展,數字內容在不同地區將采用不同的分發模式,例如分省分發模式。由于不同省份擁有不同的審查制度、地域文化、用戶偏好等因素,導致各省上線的影視內容存在著差異性和不完整性。這些影視內容的媒資信息包括但不限于影視名稱、導演、演員、發行時間、評分、出版地區、劇情描述等,各省媒資屬性質量參差不齊,存在大量媒資不全甚至錯誤的問題。目前對媒資進行核對存在著成本高、效率低的問題。
技術實現思路
1、本申請的目的旨在至少能解決上述的技術缺陷之一,特別提供了一套高效的媒體資源匹配方案。
2、第一方面,本申請提供了一種媒資匹配方法,包括:
3、獲取待匹配媒資對應的第一描述信息和目標媒資對應的第二描述信息;第二描述信息內的屬性包括一種基礎屬性;
4、在第二描述信息內存在除基礎屬性之外的附加屬性的情況下,確定附加屬性的數量;
5、根據預設單位權重設置附加屬性的權重,并根據數量和預設單位權重的乘積以及預設總權重,確定基礎屬性的權重;
6、根據基礎屬性在第一描述信息、第二描述信息的屬性值以及基礎屬性對應的相似度計算方式確定基礎屬性對應的子相似度,根據附加屬性在第一描述信息、第二描述信息的屬性值以及附加屬性對應的相似度計算方式確定附加屬性對應的子相似度;
7、根據各子相
8、若總相似度大于設定閾值,則判定待匹配媒資與目標媒資匹配,否則,判定待匹配媒資與目標媒資不匹配。
9、在其中一個實施例中,附加屬性包括第一附加屬性,第一附加屬性對應的相似度計算方式包括:
10、利用詞向量生成模型分別對第一附加屬性在第一描述信息和第二描述信息的屬性值進行轉換;
11、根據轉換所得到的詞向量之間的余弦相似度,得到第一附加屬性對應的子相似度。
12、在其中一個實施例中,詞向量生成模型的訓練過程包括:
13、基于當前的詞向量生成模型,判斷第一訓練集中各第一二元組中的兩個樣本是否相似,得到第一結果集;第一二元組中包括錨點媒資及其對應的正樣本,第一結果集中包括各第一二元組對應的判斷結果;
14、判斷第一結果集的正確比例是否大于第一閾值;
15、若否,則調整當前的詞向量生成模型,并返回基于當前的詞向量生成模型,判斷第一訓練集中各第一二元組中的兩個樣本是否相似,得到第一結果集的步驟繼續執行;
16、若是,則基于當前的詞向量生成模型,判斷第二訓練集中各第二二元組中的兩個樣本是否相似,得到第二結果集;第一二元組中包括錨點媒資及其對應的負樣本,第二結果集中包括各第二二元組對應的判斷結果;
17、判斷第二結果集的正確比例是否大于第二閾值;
18、若否,則調整當前的詞向量生成模型,并返回基于當前的詞向量生成模型,判斷第二訓練集中各第二二元組中的兩個樣本是否相似,得到第二結果集的步驟繼續執行;
19、若是,則基于當前的詞向量生成模型,判斷第三訓練集中各第一三元組中的錨點媒資是否與其他兩個樣本是否相似,得到第三結果集;第一三元組包括錨點媒資及其對應的正樣本和相似負樣本,第三結果集中包括各第一三元組對應的判斷結果;
20、判斷第三結果集的正確比例是否大于第三閾值;
21、若否,則調整當前的詞向量生成模型,并返回基于當前的詞向量生成模型,判斷第三訓練集中各第一三元組中的錨點媒資是否與其他兩個樣本是否相似,得到第三結果集的步驟繼續執行;
22、若是,則將當前的詞向量生成模型確定為最終的詞向量生成模型。
23、在其中一個實施例中,第一附加屬性包括媒資類型和/或內容簡介。
24、在其中一個實施例中,附加屬性包括第二附加屬性,第二附加屬性對應的相似度計算方式包括:
25、判斷第二附加屬性在第一描述信息、第二描述信息的屬性值是否相同;
26、根據判斷結果得到第二附加屬性對應的子相似度。
27、在其中一個實施例中,第二附加屬性包括分發地區和/或媒資年份。
28、在其中一個實施例中,附加屬性包括第三附加屬性,第三附加屬性對應的相似度計算方式包括:
29、確定第三附加屬性在第一描述信息、第二描述信息的屬性值之間的杰卡德系數;
30、根據杰卡德系數得到第三附加屬性對應的子相似度。
31、在其中一個實施例中,第三附加屬性包括演職員信息。
32、在其中一個實施例中,基礎屬性為媒資名稱,基礎屬性對應的相似度計算方式包括:
33、確定基礎屬性在第一描述信息和第二描述信息的屬性值之間的編輯距離;
34、根據編輯距離確定基礎屬性對應的子相似度。
35、第二方面,本申請提供了一種計算機設備,包括一個或多個處理器,以及存儲器,存儲器中存儲有計算機可讀指令,計算機可讀指令被一個或多個處理器執行時,執行上述任一實施例中的媒資匹配方法的步驟。
36、第三方面,一種計算機可讀存儲介質,計算機可讀存儲介質中存儲有計算機可讀指令,計算機可讀指令被一個或多個處理器執行時,使得一個或多個處理器執行上述任一實施例中的媒資匹配方法的步驟。
37、從以上技術方案可以看出,本申請實施例具有以下優點:
38、本實施例中的媒資匹配方法區分了媒體資源描述信息中的基礎屬性和附加屬性,根據附加屬性的存在情況動態調整基礎屬性的權重,能夠更準確地衡量媒資之間的相似程度。這種方法具有較強的靈活性和適應性,可根據實際情況調整權重和閾值等參數,對于描述信息的長度也沒有限制,可滿足不同的業務需求。此外,能夠快速有效地判斷媒資是否匹配,提高了媒資管理和檢索的效率,為用戶提供更精準的媒資推薦和服務。
本文檔來自技高網...【技術保護點】
1.一種媒資匹配方法,其特征在于,包括:
2.根據權利要求1所述的媒資匹配方法,其特征在于,所述附加屬性包括第一附加屬性,所述第一附加屬性對應的相似度計算方式包括:
3.根據權利要求2所述的媒資匹配方法,其特征在于,所述詞向量生成模型的訓練過程包括:
4.根據權利要求2所述的媒資匹配方法,其特征在于,所述第一附加屬性包括媒資類型和/或內容簡介。
5.根據權利要求1所述的媒資匹配方法,其特征在于,所述附加屬性包括第二附加屬性,所述第二附加屬性對應的相似度計算方式包括:
6.根據權利要求5所述的媒資匹配方法,其特征在于,所述第二附加屬性包括分發地區和/或媒資年份。
7.根據權利要求1所述的媒資匹配方法,其特征在于,所述附加屬性包括第三附加屬性,所述第三附加屬性對應的相似度計算方式包括:
8.根據權利要求1所述的媒資匹配方法,其特征在于,所述第三附加屬性包括演職員信息。
9.根據權利要求1所述的媒資匹配方法,其特征在于,所述基礎屬性為媒資名稱,所述基礎屬性對應的相似度計算方式包括:
< ...【技術特征摘要】
1.一種媒資匹配方法,其特征在于,包括:
2.根據權利要求1所述的媒資匹配方法,其特征在于,所述附加屬性包括第一附加屬性,所述第一附加屬性對應的相似度計算方式包括:
3.根據權利要求2所述的媒資匹配方法,其特征在于,所述詞向量生成模型的訓練過程包括:
4.根據權利要求2所述的媒資匹配方法,其特征在于,所述第一附加屬性包括媒資類型和/或內容簡介。
5.根據權利要求1所述的媒資匹配方法,其特征在于,所述附加屬性包括第二附加屬性,所述第二附加屬性對應的相似度計算方式包括:
6.根據權利要求5所述的媒資匹配方法,其特征在于,所述第二附加屬性包...
【專利技術屬性】
技術研發人員:許文華,劉文媛,王意銘,柳斌,
申請(專利權)人:天翼數字生活科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。