本發(fā)明專利技術(shù)提供了一種自動(dòng)獲取音視頻字幕和歌詞并快速定位檢索及個(gè)性化顯示的方法,由連接控制模塊、特征值提取模塊、字幕和歌詞查找模塊、字幕和歌詞下載模塊、字幕和歌詞定位檢索模塊、字幕和歌詞顯示模塊組成。通過該系統(tǒng),用戶提取到音視頻資源的特征值后,連接到互聯(lián)網(wǎng),查找該資源對(duì)應(yīng)的字幕或歌詞文件,并將該文件下載到本地存儲(chǔ)器上并對(duì)文件內(nèi)容進(jìn)行解析,將解析后的字幕或歌詞隨同音視頻的播放而同步顯示;使用本發(fā)明專利技術(shù),可以快速而準(zhǔn)確的查找到音視頻資源的字幕或歌詞文件。
Method for automatically acquiring captions and lyrics of music and video, and fast positioning, retrieval and personalized display
The present invention provides a method for automatic acquisition of audio and video subtitles and lyrics and fast location retrieval and personalized display, by connecting the control module, feature extraction module, search module, lyrics subtitles and subtitles and download the lyrics subtitle and lyrics positioning module, search module, display module and lyrics subtitle. Through this system, the user to extract features of audio and video resources value, connected to the Internet, to find the resources corresponding to the subtitles or lyrics file, and the file will be downloaded to the local memory and parses the contents of the documents, will be played after parsing the subtitles or lyrics with video and homophone synchronous display of the invention;, can quickly and accurately find the audio and video resource subtitles or lyrics file.
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及互聯(lián)網(wǎng)、音視頻播放領(lǐng)域,尤其涉及一種自動(dòng)獲取音視頻字幕和歌詞 并快速定位檢索及個(gè)性化顯示的方法。
技術(shù)介紹
音視頻播放同步顯示歌詞或字幕的功能使得人們?cè)诓シ乓粢曨l的同時(shí)能夠看到 該音視頻文件的字幕或歌詞,該功能已經(jīng)成為了音視頻播放軟件及播放器的必備功能之 一。現(xiàn)有的同步字幕或歌詞顯示功能技術(shù)一般都是在播放音視頻文件的同時(shí),搜索與該音 頻文件名稱匹配的字幕或歌詞文件,從而達(dá)到同步顯示的目的。同步顯示字幕或歌詞信息,播放軟件或播放器需要搜索與待顯示音視頻文件名稱 同名的字幕或歌詞文件,若搜索到,則同步顯示字幕或歌詞信息;否則,則做默認(rèn)處理。然而 存在以下情況是現(xiàn)有技術(shù)無法解決的,如有很多音視頻文件是具有相同的名字,卻有不同 的字幕或歌詞內(nèi)容。例如“朋友”這首歌,有周華健演唱的,有臧天朔演唱的,還有張震岳 演唱的等等。這種情況下,與“朋友.mp3”相應(yīng)的同步歌詞文件“朋友.Irc “不止一個(gè),而 且文件名都是一樣的,播放軟件就會(huì)搜索到多個(gè)同名的字幕或歌詞文件,現(xiàn)有技術(shù)對(duì)于這 種同名文件不能進(jìn)行有效的鑒別;音視頻文件隨便命名的情況,通過現(xiàn)有技術(shù)無法找到對(duì) 應(yīng)的字幕或歌詞文件,無法進(jìn)行同步顯示。
技術(shù)實(shí)現(xiàn)思路
針對(duì)上述這些問題,設(shè)計(jì)了一種自動(dòng)獲取音視頻字幕和歌詞并快速定位檢索及個(gè) 性化顯示的方法。該方法使用了音視頻特征值,無論音視頻文件如何轉(zhuǎn)換、壓縮、文件名稱 如何變化,特征值都能唯一的標(biāo)識(shí)音視頻,通過這個(gè)特點(diǎn)就能以盡可能高的準(zhǔn)確性獲取音 視頻字幕和歌詞,不會(huì)出現(xiàn)音視頻與字幕或歌詞不匹配的問題。為了實(shí)現(xiàn)上述的專利技術(shù),本專利技術(shù)的技術(shù)方案以如下方式實(shí)現(xiàn),其結(jié)構(gòu)特 點(diǎn)是,它是由連接控制模塊,特征值提取模塊,字幕和歌詞查找模塊,字幕和歌詞下載模塊, 字幕和歌詞定位檢索模塊,字幕和歌詞顯示模塊組成。連接控制模塊在查詢音視頻的字幕或歌詞時(shí),負(fù)責(zé)連接到音視頻字幕和歌詞服 務(wù)器及音視頻信息備案庫(kù)。特征值提取模塊提取要查詢字幕或歌詞的音視頻特征值。字幕和歌詞查找模塊使用提取的音視頻特征值作為條件,在音視頻信息備案庫(kù) 中查詢,如果有記錄,表示該音視頻信息已經(jīng)備案,那么提取標(biāo)準(zhǔn)的音視頻名稱,根據(jù)這個(gè) 名稱可以查找到字幕或歌詞;如果沒有記錄,表示該音視頻信息沒有備案,那么將特征值存 入音視頻信息備案庫(kù),并打上沒有字幕或歌詞的標(biāo)記,以備操作人員編輯。字幕和歌詞下載模塊鎖定音視頻字幕或歌詞文件,根據(jù)下載設(shè)置把文件下載到本地存儲(chǔ)器的指定目錄中。字幕和歌詞定位檢索模塊在音視頻播放時(shí),使用本模塊從字幕或歌詞文件中按 照時(shí)間點(diǎn)提取字幕或歌詞,當(dāng)用戶拖動(dòng)時(shí)間軸時(shí),與時(shí)間軸上時(shí)間點(diǎn)對(duì)應(yīng)的字幕或歌詞也 需要移動(dòng),本模塊可以針對(duì)不同格式的字幕和歌詞文件,采用獨(dú)有算法快速檢索對(duì)應(yīng)時(shí)間 軸上時(shí)間點(diǎn)的字幕或歌詞。字幕和歌詞顯示模塊本模塊根據(jù)字幕和歌詞定位檢索模塊鎖定的字幕或歌詞, 在音視頻播放時(shí)顯示出來,字幕或歌詞在顯示時(shí)可以調(diào)整字體大小、字體名稱、字體顏色、 顯示位置等屬性。本技術(shù)進(jìn)行在線音視頻下載播放的步驟參看圖1,本專利技術(shù)由連接控制模塊1、特征值提取模塊2、字幕和歌詞查找模塊3、字 幕和歌詞下載模塊4、字幕和歌詞定位檢索模塊5、字幕和歌詞顯示模塊6組成。實(shí)現(xiàn)對(duì)音 視頻字幕和歌詞的準(zhǔn)確獲取。參看圖2,使用本專利技術(shù)獲取音視頻字幕和歌詞并顯示的流程1.通過特征值提取模塊1針對(duì)視頻和音頻采用不同的方式提取特征值。2.通過連接控制模塊2連接到音視頻字幕和歌詞服務(wù)器及音視頻信息備案庫(kù)。3.通過字幕和歌詞查找模塊3以特征值為條件查詢音視頻信息備案庫(kù),如果沒有 查詢到相應(yīng)的記錄,將音視頻的特征值信息存入音視頻備案信息庫(kù),并打上沒有字幕或歌 詞的標(biāo)記,以備操作人員編輯;如果查詢到相應(yīng)的記錄,提取標(biāo)準(zhǔn)的音視頻名稱,根據(jù)這個(gè) 名稱鎖定字幕或歌詞文件。4.通過字幕和歌詞下載模塊4將通過字幕和歌詞查找模塊3鎖定的字幕或歌詞文 件,根據(jù)下載設(shè)置保存到本地存儲(chǔ)器上的指定目錄中。5.在字幕或歌詞顯示時(shí),首先通過字幕和歌詞定位檢索模塊5按照時(shí)間軸上的時(shí) 間點(diǎn)檢索字幕或歌詞,然后交給字幕和歌詞顯示模塊6顯示;當(dāng)時(shí)間軸被用戶拖動(dòng)時(shí),對(duì)應(yīng) 的字幕或歌詞也需要移動(dòng),通過字幕和歌詞定位檢索模塊5使用獨(dú)有的算法,快速檢索定 位對(duì)應(yīng)時(shí)間軸上時(shí)間點(diǎn)的字幕或歌詞,并交給字幕和歌詞顯示模塊6顯示。附圖說明圖1為本專利技術(shù)的結(jié)構(gòu)圖;圖2為本專利技術(shù)進(jìn)行音視頻字幕或歌詞獲取并顯示的流程圖; 具體實(shí)施例方式參看圖1,本專利技術(shù)由連接控制模塊1、特征值提取模塊2、字幕和歌詞查找模塊3、字 幕和歌詞下載模塊4、字幕和歌詞定位檢索模塊5、字幕和歌詞顯示模塊6組成。實(shí)現(xiàn)對(duì)音 視頻資源字幕和歌詞的準(zhǔn)確抓取。提高了用戶的觀賞性。參看圖2,用本專利技術(shù)準(zhǔn)備抓取音視頻資源的字幕和歌詞并顯示1.通過特征值提取模塊1當(dāng)查找的是視頻字幕時(shí),視頻特征值是利用每個(gè)相鄰幀 間變化的特征,計(jì)算相鄰幀間的相關(guān)性,選擇相鄰若干幀之間差異變化最大或差異變化最 小或符合確定規(guī)則的若干特征,將所述的特征塊進(jìn)行編碼形成的特征值;當(dāng)查找的是音頻 歌詞時(shí),音頻特征值是根據(jù)音頻聲音的波形變化計(jì)算得來的,音頻聲音的波形無論壓縮、格式轉(zhuǎn)換、聲音大小調(diào)節(jié)、降噪等處理后,其波形變化規(guī)律是不變的,根據(jù)這個(gè)特性使用特有 的算法計(jì)算出該音頻文件的特征值,通過以上的說明,可以確定特征值唯一的標(biāo)識(shí)一個(gè)音 視頻,通過特征值獲取音視頻的字幕或歌詞,可以保證盡可能高的準(zhǔn)確性。2.通過連接控制模塊2自動(dòng)連接到網(wǎng)絡(luò),并登陸音視頻信息備案庫(kù),為音視頻資 源的字幕、歌詞的查詢做準(zhǔn)備。3.字幕和歌詞查找模塊3以特征值為條件對(duì)音頻信息備案庫(kù)進(jìn)行查詢。如果沒有 查詢到相應(yīng)的記錄,將音視頻的特征值信息存入音視頻備案信息庫(kù),并打上沒有字幕或歌 詞的標(biāo)記,以備操作人員編輯;如果查詢到相應(yīng)的記錄,提取標(biāo)準(zhǔn)的音視頻名稱,根據(jù)這個(gè) 名稱鎖定字幕或歌詞文件。4.通過字幕和歌詞下載模塊4將通過字幕和歌詞查找模塊3鎖定的字幕或歌詞文 件,根據(jù)下載設(shè)置保存到本地存儲(chǔ)器上的指定目錄中。5.在字幕或歌詞顯示時(shí),首先通過字幕和歌詞定位檢索模塊5按照時(shí)間軸上的時(shí) 間點(diǎn)檢索字幕或歌詞,然后交給字幕和歌詞顯示模塊6顯示;當(dāng)時(shí)間軸被用戶拖動(dòng)時(shí),對(duì)應(yīng) 的字幕或歌詞也需要移動(dòng),通過字幕和歌詞定位檢索模塊5使用獨(dú)有的算法,快速檢索定 位對(duì)應(yīng)時(shí)間軸上時(shí)間點(diǎn)的字幕或歌詞,并交給字幕和歌詞顯示模塊6顯示。權(quán)利要求1.,其特征在 于,所述方法包括以下步驟第一步驟提取音視頻的特征值;第二步驟連接到音視頻字幕和歌詞服務(wù)器及音視頻信息備案庫(kù); 第三步驟以特征值為條件查詢音視頻信息備案庫(kù),鎖定字幕或歌詞文件; 第四步驟將鎖定的字幕或歌詞文件,下載到本地存儲(chǔ)器上的指定目錄中; 第五步驟按照下載的字幕或歌詞文件,在音視頻播放時(shí)顯示字幕或歌詞。2.,其特征在 于,所述方法包括特征值提取模塊,針對(duì)視頻格式和音頻格式采用不同的方式提取音視頻的特征值; 連接控制模塊,負(fù)責(zé)連接音視頻字幕和歌詞服務(wù)器及音視頻信息備案庫(kù); 字幕和歌詞查找模塊,在音視頻信息備案庫(kù)中,以音視頻特征值為條件,查詢有無備案 記錄并鎖定字幕或歌詞文件;字幕或歌詞字幕和歌詞下載模塊,將鎖定的字幕或歌詞文件,按照下載設(shè)置下載到本 地存儲(chǔ)器上的指定目錄中;字幕和歌詞定位檢索模塊,針對(duì)不用格式的字幕或本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種自動(dòng)獲取音視頻字幕和歌詞并快速定位檢索及個(gè)性化顯示的方法,其特征在于,所述方法包括以下步驟:第一步驟:提取音視頻的特征值;第二步驟:連接到音視頻字幕和歌詞服務(wù)器及音視頻信息備案庫(kù);第三步驟:以特征值為條件查詢音視頻信息備案庫(kù),鎖定字幕或歌詞文件;第四步驟:將鎖定的字幕或歌詞文件,下載到本地存儲(chǔ)器上的指定目錄中;第五步驟:按照下載的字幕或歌詞文件,在音視頻播放時(shí)顯示字幕或歌詞。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:孫東亮,郝雪松,班志遠(yuǎn),武曉芳,
申請(qǐng)(專利權(quán))人:天擎華媒北京科技有限公司,
類型:發(fā)明
國(guó)別省市:11
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。