使用內容和揚聲器信息進行音頻信息檢索的方法和裝置制造方法及圖紙

技術編號：2886165 閱讀：209 留言：0更新日期：2012-04-11 18:40

本發明專利技術公開一種根據音頻內容和演講人標識檢索音頻信息的方法和裝置。基于內容和基于演講人的音頻信息結果被結合在一起以提供對音頻信息的引用。一個檢索同包含一個文本串及一個給定的演講人標識的文本查詢相對應的信息的查詢搜索系統。一個對音頻信息進行轉換并建立索引以創建以時間標記的內容索引文件和演講人索引文件的索引系統。一個使用所產生的內容和演講人索引，根據音頻內容和演講人標識執行查詢－文檔匹配的音頻檢索系統。（*該技術在2020年保護過期，可自由使用*）

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及信息檢索系統，更確切地，涉及從一個多媒體數據庫文件中檢索滿足用戶指定要求的多媒體信息，如音頻和視頻信息的方法和裝置。信息檢索系統主要集中在從大的文本集合中檢索文本文檔。文本檢索的基本原理已經充分地提出并整理發布。例如，可參見G.Salton，Automatic Text Processing，Addison-Wesley，1989。索引是一種將文檔描述同查詢描述進行匹配的機制。索引建立階段(indexingphase)用一組字或詞句對文檔進行描述，而檢索階段(retrieval phase)用一組字或詞句對查詢進行描述。當文檔描述同查詢描述匹配時一個文檔(或其中的一部分)得到檢索。多媒體對象，例如音頻和視頻文件所需的數據檢索模型同文本文檔所需的模型有很大的不同。對這些多媒體信息建立索引的標準特征集合有一點共性。對音頻數據庫建立索引的一種方法是使用某種音頻提示，例如鼓掌，音樂或演講。相似地，對視頻信息建立索引的一種方法是使用關鍵幀，或相片的變化。對于有影響的演講中的音頻和視頻信息，例如從廣播中摘出的音頻和視頻信息，對應的文本可以使用語音識別系統得到，而轉換文本可以用作建立相關音頻(及視頻)的索引。當前的音頻信息檢索系統包含兩個部分，即一個語音識別系統，用于將音頻信息轉換為用于建立索引的文本，和一個基于文本的信息檢索系統。語音識別系統一般由三個部分組成，即詞匯表，語言模型和一組針對詞匯表中每個詞的發音。詞匯表是由語音識別器用來將語音翻譯為文本的一組詞。作為解碼處理的一部分，該識別器將來自語音輸入的聲音同詞匯表中的詞進行匹配。因此，詞匯表定義...

【技術保護點】
一種從一或多個音頻源檢索音頻信息的方法，所述方法包括步驟：接收用戶查詢，該查詢的約束至少要指定一個內容和一個演講人；并且將所述用戶查詢同所述音頻源的一個內容索引和一個演講人索引進行比較以識別滿足用戶查詢要求的音頻信息。

【技術特征摘要】
...

【專利技術屬性】
技術研發人員：霍梅沃恩薩德莫哈姆德貝基，阿蘭查爾斯路易斯特里特施勒，瑪荷什維斯萬納坦，
申請(專利權)人：國際商業機器公司，
類型：發明
國別省市：US[美國]

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術