System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及媒資節(jié)目對(duì)齊,具體而言,涉及一種基于向量數(shù)據(jù)庫進(jìn)行媒資節(jié)目匹配對(duì)齊的方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、在影視行業(yè),由于不同片源方的影視節(jié)目名稱存在命名規(guī)范差異,現(xiàn)有媒資節(jié)目匹配方法如正則匹配結(jié)合近似算法存在諸多局限。它們無法高效匹配正確節(jié)目名,處理不了語義一致或倒序的節(jié)目名,且數(shù)據(jù)量大時(shí)匹配效率低。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的在于提供一種基于向量數(shù)據(jù)庫進(jìn)行媒資節(jié)目匹配對(duì)齊的方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)。
2、第一方面,本專利技術(shù)實(shí)施例提供一種基于向量數(shù)據(jù)庫進(jìn)行媒資節(jié)目匹配對(duì)齊的方法,包括:
3、獲取媒資庫中多個(gè)已有媒資節(jié)目的已有媒資相關(guān)信息,并對(duì)所述已有媒資相關(guān)信息進(jìn)行向量化,得到所述多個(gè)已有媒資節(jié)目各自對(duì)應(yīng)的已有媒資相關(guān)向量;
4、獲取待匹配媒資節(jié)目的待匹配媒資相關(guān)信息,并對(duì)所述待匹配媒資相關(guān)信息進(jìn)行向量化,得到所述待匹配媒資節(jié)目的待匹配媒資相關(guān)向量;
5、根據(jù)每個(gè)所述已有媒資相關(guān)向量與所述待匹配媒資相關(guān)向量的向量相似度,結(jié)合全文檢測(cè)策略,得到所述待匹配媒資相關(guān)向量對(duì)應(yīng)的匹配對(duì)齊結(jié)果;
6、在所述匹配對(duì)齊結(jié)果表征匹配成功的基礎(chǔ)上,確定節(jié)目唯一標(biāo)識(shí)并寫入映射文件。
7、在一種可能的實(shí)施方式中,所述獲取媒資庫中多個(gè)已有媒資節(jié)目的已有媒資相關(guān)信息,并對(duì)所述已有媒資相關(guān)信息進(jìn)行向量化,得到所述多個(gè)已有媒資節(jié)目各自對(duì)應(yīng)的已有媒資相關(guān)向量,包括:
8、獲取媒資
9、對(duì)所述節(jié)目名稱進(jìn)行詞向量轉(zhuǎn)化后生成已有向量文本;
10、對(duì)所述導(dǎo)演信息、演員信息、節(jié)目名稱、節(jié)目唯一標(biāo)識(shí)進(jìn)行封裝得到向量元數(shù)據(jù);
11、將所述節(jié)目唯一標(biāo)識(shí)作為向量id;
12、將所述已有向量文本、所述向量元數(shù)據(jù)以及所述向量id作為所述已有媒資相關(guān)向量,并將所述已有媒資相關(guān)向量寫入向量數(shù)據(jù)庫。
13、在一種可能的實(shí)施方式中,所述獲取待匹配媒資節(jié)目的待匹配媒資相關(guān)信息,并對(duì)所述待匹配媒資相關(guān)信息進(jìn)行向量化,得到所述待匹配媒資節(jié)目的待匹配媒資相關(guān)向量,包括:
14、獲取待匹配媒資節(jié)目的待匹配媒資相關(guān)信息,所述待匹配媒資相關(guān)信息包括導(dǎo)演信息、演員信息、節(jié)目名稱以及節(jié)目唯一標(biāo)識(shí);
15、對(duì)所述待匹配媒資相關(guān)信息進(jìn)行詞向量轉(zhuǎn)化,得到向量文本作為得到所述待匹配媒資節(jié)目的待匹配媒資相關(guān)向量。
16、在一種可能的實(shí)施方式中,根據(jù)每個(gè)所述已有媒資相關(guān)向量與所述待匹配媒資相關(guān)向量的向量相似度,結(jié)合全文檢測(cè)策略,得到所述待匹配媒資相關(guān)向量對(duì)應(yīng)的匹配對(duì)齊結(jié)果,包括:
17、將所述向量文本在所述向量數(shù)據(jù)庫中進(jìn)行遍歷相似度對(duì)比,得到所述向量文本與每個(gè)所述已有媒資相關(guān)向量的向量相似度;
18、若存在所述向量相似度高于預(yù)設(shè)向量相似度閾值的待定已有媒資相關(guān)向量,提取出所述待定已有媒資相關(guān)向量對(duì)應(yīng)的待定導(dǎo)演信息和待定演員信息;
19、在所述待定導(dǎo)演信息和所述待定演員信息,與所述待匹配媒資相關(guān)信息包括的所導(dǎo)演信息和演員信息存在交集的情況下,將所述待定已有媒資相關(guān)向量對(duì)應(yīng)的待定已有媒資節(jié)目作為所述待匹配媒資節(jié)目的成功匹配對(duì)齊結(jié)果;
20、若不存在所述向量相似度高于預(yù)設(shè)向量相似度閾值的待定已有媒資相關(guān)向量,則利用全文檢索策略得到所述待匹配媒資相關(guān)向量對(duì)應(yīng)的匹配對(duì)齊結(jié)果。
21、在一種可能的實(shí)施方式中,所述利用全文檢索策略得到所述待匹配媒資相關(guān)向量對(duì)應(yīng)的匹配對(duì)齊結(jié)果,包括:
22、利用所述全文檢索策略對(duì)所述向量數(shù)據(jù)庫進(jìn)行全文檢索,得到與所述待匹配媒資節(jié)目的節(jié)目名稱達(dá)到預(yù)設(shè)節(jié)目名稱文字相似度閾值的待定已有媒資節(jié)目;
23、提取出所述待定已有媒資相關(guān)向量對(duì)應(yīng)的待定導(dǎo)演信息和待定演員信息;
24、在所述待定導(dǎo)演信息和所述待定演員信息,與所述待匹配媒資相關(guān)信息包括的所導(dǎo)演信息和演員信息存在交集的情況下,將所述待定已有媒資相關(guān)向量對(duì)應(yīng)的待定已有媒資節(jié)目作為所述待匹配媒資節(jié)目的成功匹配對(duì)齊結(jié)果。
25、在一種可能的實(shí)施方式中,所述在所述匹配對(duì)齊結(jié)果表征匹配成功的基礎(chǔ)上,確定節(jié)目唯一標(biāo)識(shí)并寫入映射文件,包括:
26、在所述匹配對(duì)齊結(jié)果表征匹配成功的基礎(chǔ)上,獲取所述成功匹配對(duì)齊結(jié)果對(duì)應(yīng)的至少一個(gè)待匹配媒資節(jié)目;
27、提取所述獲取待匹配媒資節(jié)目和所述至少一個(gè)待匹配媒資節(jié)目各自對(duì)應(yīng)的節(jié)目唯一標(biāo)識(shí);
28、根據(jù)所述各自對(duì)應(yīng)的節(jié)目唯一標(biāo)識(shí)寫入所述映射文件。
29、在一種可能的實(shí)施方式中,所述方法還包括:
30、響應(yīng)于查找媒資節(jié)目指令,獲取所述查找媒資節(jié)目指令包括的查找節(jié)目唯一標(biāo)識(shí);
31、根據(jù)所述查找節(jié)目唯一標(biāo)識(shí)從所述映射文件中確定出所述查找媒資節(jié)目指令對(duì)應(yīng)的查找媒資節(jié)目,所述查找媒資節(jié)目的節(jié)目唯一標(biāo)識(shí)與所述查找節(jié)目唯一標(biāo)識(shí)關(guān)聯(lián)寫入在所述映射文件中。
32、第二方面,本專利技術(shù)實(shí)施例提供一種基于向量數(shù)據(jù)庫進(jìn)行媒資節(jié)目匹配對(duì)齊的裝置,包括:
33、獲取模塊,用于獲取媒資庫中多個(gè)已有媒資節(jié)目的已有媒資相關(guān)信息,并對(duì)所述已有媒資相關(guān)信息進(jìn)行向量化,得到所述多個(gè)已有媒資節(jié)目各自對(duì)應(yīng)的已有媒資相關(guān)向量;獲取待匹配媒資節(jié)目的待匹配媒資相關(guān)信息,并對(duì)所述待匹配媒資相關(guān)信息進(jìn)行向量化,得到所述待匹配媒資節(jié)目的待匹配媒資相關(guān)向量;
34、對(duì)齊模塊,用于根據(jù)每個(gè)所述已有媒資相關(guān)向量與所述待匹配媒資相關(guān)向量的向量相似度,結(jié)合全文檢測(cè)策略,得到所述待匹配媒資相關(guān)向量對(duì)應(yīng)的匹配對(duì)齊結(jié)果;在所述匹配對(duì)齊結(jié)果表征匹配成功的基礎(chǔ)上,確定節(jié)目唯一標(biāo)識(shí)并寫入映射文件。
35、第三方面,本專利技術(shù)實(shí)施例提供一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括處理器及存儲(chǔ)有計(jì)算機(jī)指令的非易失性存儲(chǔ)器,所述計(jì)算機(jī)指令被所述處理器執(zhí)行時(shí),所述計(jì)算機(jī)設(shè)備執(zhí)行第一方面至少一種可能的實(shí)施方式所述的方法。
36、第四方面,本專利技術(shù)實(shí)施例提供一種可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序運(yùn)行時(shí)控制所述可讀存儲(chǔ)介質(zhì)所在計(jì)算機(jī)設(shè)備執(zhí)行第一方面至少一種可能的實(shí)施方式所述的方法。
37、相比現(xiàn)有技術(shù),本專利技術(shù)提供的有益效果包括:采用本專利技術(shù)公開的一種基于向量數(shù)據(jù)庫進(jìn)行媒資節(jié)目匹配對(duì)齊的方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì),通過獲取媒資庫中已有媒資節(jié)目和待匹配媒資節(jié)目的相關(guān)信息并向量化。然后根據(jù)已有和待匹配媒資相關(guān)向量的相似度,結(jié)合全文檢測(cè)策略得出匹配對(duì)齊結(jié)果。若匹配成功,確定節(jié)目唯一標(biāo)識(shí)并寫入映射文件。如此設(shè)計(jì),解決了現(xiàn)有技術(shù)的不足,提高了媒資節(jié)目匹配的準(zhǔn)確性和效率。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于向量數(shù)據(jù)庫進(jìn)行媒資節(jié)目匹配對(duì)齊的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取媒資庫中多個(gè)已有媒資節(jié)目的已有媒資相關(guān)信息,并對(duì)所述已有媒資相關(guān)信息進(jìn)行向量化,得到所述多個(gè)已有媒資節(jié)目各自對(duì)應(yīng)的已有媒資相關(guān)向量,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取待匹配媒資節(jié)目的待匹配媒資相關(guān)信息,并對(duì)所述待匹配媒資相關(guān)信息進(jìn)行向量化,得到所述待匹配媒資節(jié)目的待匹配媒資相關(guān)向量,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)每個(gè)所述已有媒資相關(guān)向量與所述待匹配媒資相關(guān)向量的向量相似度,結(jié)合全文檢測(cè)策略,得到所述待匹配媒資相關(guān)向量對(duì)應(yīng)的匹配對(duì)齊結(jié)果,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述利用全文檢索策略得到所述待匹配媒資相關(guān)向量對(duì)應(yīng)的匹配對(duì)齊結(jié)果,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述在所述匹配對(duì)齊結(jié)果表征匹配成功的基礎(chǔ)上,確定節(jié)目唯一標(biāo)識(shí)并寫入映射文件,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:<
...【技術(shù)特征摘要】
1.一種基于向量數(shù)據(jù)庫進(jìn)行媒資節(jié)目匹配對(duì)齊的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取媒資庫中多個(gè)已有媒資節(jié)目的已有媒資相關(guān)信息,并對(duì)所述已有媒資相關(guān)信息進(jìn)行向量化,得到所述多個(gè)已有媒資節(jié)目各自對(duì)應(yīng)的已有媒資相關(guān)向量,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取待匹配媒資節(jié)目的待匹配媒資相關(guān)信息,并對(duì)所述待匹配媒資相關(guān)信息進(jìn)行向量化,得到所述待匹配媒資節(jié)目的待匹配媒資相關(guān)向量,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)每個(gè)所述已有媒資相關(guān)向量與所述待匹配媒資相關(guān)向量的向量相似度,結(jié)合全文檢測(cè)策略,得到所述待匹配媒資相關(guān)向量對(duì)應(yīng)的匹配對(duì)齊結(jié)果,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述利用全文...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王一淏,李富倉,
申請(qǐng)(專利權(quán))人:廣州歡網(wǎng)科技有限責(zé)任公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。