【技術實現步驟摘要】
本專利技術涉及一種基于人臉檢測的網絡視頻縮略圖提取及映射方法
技術介紹
目前網絡爬蟲只爬取文本,不能爬取音樂、圖片和視頻等多媒體文件,原因主要是多媒體數據量巨大;如何下載傳輸多媒體文件;如何索引多媒體文件;進而對處理過的多媒體文件進行檢索。現在因特網上有大量的多媒體文件,特別是社交網站和多媒體分享的興起,需要對多媒體文件進行精準檢索。網絡爬蟲,也稱網絡蜘蛛、網絡機器人,是一個自動提取網頁的程序,它從因特網上下載網頁,是搜索引擎的重要組成部分。網絡爬蟲利用標準的HTTP協議,根據超級鏈接和Web文檔檢索的方法遍歷因特網信息空間。因特網上有數千種不同的數據類型,HTTP給每種要通過Web傳輸的對象都打上了名為MIME類型的數據格式標簽(常見視頻格式:video/MP4V-ES,video/mpeg,video/quicktime,video/vnd.mpegurl,video/x-msvideo)(常見圖片格式:image/jpeg,image/gif)。統一資源定位符(URL)是資源標識符最常見的形式。URL描述了一臺特定服務器上某資源的特定位置。元素文件(METAFILE)可提供有關頁面的元信息,如針對搜索引擎和更新頻度的描述和關鍵詞,可針對元素的關鍵詞進行索引。UDP是OSI參考模型中一種無連接的傳輸層協議,它主要用于不要求分組順序到達的傳輸中,分組傳輸順序的檢查與排序由應用層完成,提供面向事務的簡單不可靠信息傳送服務。網絡圖片可通過UDP進行下載,因為UDP具有TCP所望塵莫及的速度優勢。基于關鍵幀的網絡視頻格式文件摘要提取,計算量非常大,實時要求很 ...
【技術保護點】
一種基于人臉檢測的網絡視頻縮略圖提取及映射方法,其具體步驟如下:1)通過URL確定網絡視頻縮略圖的地址;2)利用UDP協議緩存下載網絡視頻縮略圖;3)結合Haar分類器人臉檢測,提取網絡視頻縮略圖的特征向量并索引,建立與URL的映射;4)然后存儲到服務器集成數據中心;5)以便對網絡視頻縮略圖,進行關鍵詞基礎上的精準檢索。
【技術特征摘要】
1.一種基于人臉檢測的網絡視頻縮略圖提取及映射方法,其具體步驟如下:1)通過URL確定網絡視頻縮略圖的地址;2)利用UDP協議緩存下載網絡視頻縮略圖;3)結合Ha...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。