本發明專利技術涉及一種驗證多媒體文件中顯著區域的方法。根據本發明專利技術,所述方法包括以下步驟:基于從所述文件中提取的先驗數據,確定(E1)所述文件中被認為是關鍵區域的區域;基于顯著圖的編輯,把模型應用(E2)到所述文件,以獲得所述文件的顯著圖;在所述文件中被認為關鍵的區域與所述顯著圖之間進行比較(E3)。
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術涉及用于驗證多媒體文件中顯著區域(saliencyarea)的設備和過程。
技術介紹
更具體地,本專利技術涉及內容的評估,尤其是如廣告文件之類的文 件的內容的評估。現今,當一個人要突出內容時,已經知道各種用于創建內容的技術很簡單地,在寫文本文件時,可以在字句上劃線、可以以粗體書寫、可以加邊框等等。廣告者使用更復雜的技術,對于視頻或音頻,可以結合圖像處理技術和聲音處理技術,更一般地,可以結合信號處理技術。評估這些技術的有效性是很困難的。廣告通常非常吸引人,但是所實現的各種效果并不總是有效, 一定可以改進。當前,視覺(oculometric)技術可以幫助確定顯著區域。然而, 這樣的技術是手動的,由于其不允許多個文件、Web頁面、視頻文件 的處理過程的自動操作,因此難以實現。
技術實現思路
為了這個目的,本專利技術提出了一種驗證多媒體文件中顯著區域的 方法。根據本專利技術,所述方法包括以下步驟-基于從所述文件中提取的先驗數據,確定所述文件中被認為是關 鍵區域的區域,-基于顯著圖(saliency map)的編輯,把模型應用到所述文件, 以獲得所述文件的顯著圖,-在所述文件中被認為關鍵的區域與所述顯著圖之間進行比較。 根據優選實施例,所述方法包括如下步驟計算所述文件的關鍵區域中所包含的顯著度與所述文件的總顯著度的比值。根據優選實施例,所述方法包括如下步驟計算在觀看所述文件過程中指示眼睛的過程的視覺路徑,所述視覺路徑基于所述顯著圖來計算,并由圖像中顯著度大于閾值的像素組成。根據優選實施例,在搜索所述視覺路徑過程中, -搜索所述文件中具有最大顯著度的像素, -使所述文件中圍繞所述最大值的區域無效,以及 -搜索具有最大顯著度的下一個像素,直到獲得具有大于所述閾值的顯著度的所有像素。優選地,編輯分析報告,所述分析報告包括所述文件的顯著區域、所述視覺路徑以及表示顯著區域的子圖像集合。根據優選實施例,所述報告包括所述文件的關鍵區域。 本專利技術也涉及創建廣告文件的方法。根據本專利技術,所述方法交替地包括創建內容的步驟,隨后是根據本專利技術的驗證所述文件中的顯著區域的方法,只要所述顯著區域與所述文件的關鍵區域不相對應,就重復所述步驟。本專利技術也涉及自動驗證因特網網站的顯著區域的方法。根據本專利技術,所述方法包括針對網站的每個頁面的如下步驟-基于從所述頁面中提取的先驗數據,確定所述頁面中被認為是關 鍵區域的區域,-基于顯著圖的編輯,把模型應用到所述頁面,以獲得所述頁面的 顯著圖,-在所述頁面中被認為關鍵的區域與所述顯著圖之間進行比較。 本專利技術也涉及一種包括程序代碼指令的計算機程序產品,當計算機執行所述程序時,所述程序代碼指令用于執行根據本專利技術的任一實施例的方法的步驟。附圖說明參照圖1,通過完全非限制的優選示例性實施例和實現方式,將 更好地理解和說明本專利技術,圖1示出根據本專利技術的優選方式的驗證過程。具體實施例方式本專利技術對廣告特性的文件尤其有利,在這樣的文件中,文件的組 成部分由于其經濟影響而尤其重要。具體地,廣告片尤其適用于放置 對消費者有吸引力的消息,所述廣告片是視頻、簡單地音頻或雜志中 的靜止圖像類型。然而,有時,這些消息并未必要地位于最吸引人類 注意力的區域,在這種情況下,廣告者將不能創建具有所希望的效果 的文件。因此,本專利技術的目的是提供分析文件的裝置,以驗證這些文件對 其受眾具有所需的影響,不論其是否是廣告文件。因此,存在用于計算文件的顯著圖的過程。這些過程使得能夠確 定吸引注意力的區域。這些過程基于考慮了圖像的各種參數的計算, 并基于圖像和/或視頻的空間和/或時間分析。顯著圖是圖像感知的地形表示(topographic representation)。確定 圖像的每個像素的視覺相關性。例如,該圖被歸一化在0至255之間。 該值越大,像素就越吸引注意力。例如,在以Thomson Licensing SA名義申請的、于2005年6月22日 以1544792號公布的歐洲專利申請中描述了這樣的過程。圖l表示了根據本專利技術的優選方式的方法的步驟。 提供商用文件類型的紙質文件D。該文件是基于一件HTML類型 的出版軟件創建的,其電子版可用,所述出版軟件是例如acrobat writer (adobe公司的注冊商標)、word (微軟公司的注冊商標)。因此,可以 從該文件中提取先驗信息,該先驗信息反映了文件的作者希望突出的 內容。例如,在word類型的文件中,可以根據所使用的字符大小、所 使用的字體、劃線、所使用的顏色來判斷信息的重要性。也可以使用 圖紙上的位置來判斷信息的重要性, 一般而言重要的信息被放在圖像 的中心。 在html類型的文件中,"標簽"也有助于確定作者要突出的點。因此,通過觀察文件D以手動的方式,或通過自動提取上述特征 以自動的方式,可以編輯(步驟E1)表示根據作者的文件D的關鍵點 的先驗信息。因此,可以獲得文件中感興趣區域的地理位置。此外,提供了一種使建立文件的顯著圖成為可能的模型。在步驟 E2中,對文件D應用該模型。例如,該模型是接收文件D作為輸入的 一個軟件。該模型分析用于顯著圖的提取所需的文件的特征,以獲得 文件D的顯著圖。例如,在以Thomson Licensing SA名義申請的、于2005年6月22日 以1544792號公布的歐洲專利申請中描述了這樣的過程。這些過程基于 考慮了圖像的各種參數的計算,并基于圖像和/或視頻的空間和/或時 間分析。當視頻文件中包括文本時,由于文本類型的信息以及表面類型的 信息也代表被認為重要的信息,因此也提取文本類型的信息以及表面 類型的信息。具體地,在2003年的期刊"multimedia systems"所發表的Hu、 Xie 、 Chen 、 Ma的文獻"attention model based progressive image tmnsmission"以及Chen等人的文獻"a visual attention model for adapting images on small displays"中,描述了在編輯顯著圖過程中對表面或文 本類型的信息的考慮。在步驟E3,基于顯著圖,獲得包含以下信息的分析報告-指示有吸引力的區域的熱圖(heatmap),-指示普通觀察者的視覺過程的視覺路徑圖。根據希望獲得的最大值數目,或根據圖像的全局顯著度,該視覺 過程是通過在顯著圖上搜索具有大于閾值的顯著度值的局部最大值來 獲得的。例如,搜索局部最大值可以通過使第(n-1)個最大值周圍的 圓形區域(表示等于0.5的可視度的半徑的凹處)無效并通過搜索這個 新圖的全局最大值并對每個最大值繼續這樣的處理而進行。因此,對 每個最大值獲得一個區域,此后將這些區域n-l,n,…的中心連接,以獲得普通觀察者的視覺過程。-感知總結,包含要分析的圖像的n個子圖像。這些子圖像是觀察者注視的區域。在以Thomson Licensing公司名義申請的、于2005年9月19日以 05291938.8號提出的歐洲專利申請中描述了這樣的用于確定子圖像的 過程。0. Le Meur, X. Castellan, P. Le Callet和D. Barba, Efficient saliency-based repurpos本文檔來自技高網...
【技術保護點】
一種用于驗證多媒體文件中的顯著區域的方法,其特征在于,所述方法包括以下步驟: -基于從所述文件中提取的先驗數據,確定(E1)所述文件中被認為是關鍵區域的區域, -基于顯著圖的編輯,把模型應用(E2)到所述文件,以獲得所述文件的顯著圖, -在所述文件中被認為關鍵的區域與所述顯著圖之間進行比較(E3)。
【技術特征摘要】
【國外來華專利技術】...
【專利技術屬性】
技術研發人員:奧利弗勒默爾,哈維爾卡斯特蘭,米歇爾凱爾德朗瓦,
申請(專利權)人:湯姆森許可貿易公司,
類型:發明
國別省市:FR[法國]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。