當前位置: 首頁 > 專利查詢>王磊專利>正文

一種對音頻或視頻內容附加標簽的方法技術

技術編號：13674885 閱讀：111 留言：0更新日期：2016-09-08 00:21

本發明專利技術涉及對音頻、視頻內容附加標簽的方法和系統，本發明專利技術涉及對人聲的檢測。本發明專利技術提供一種對音頻或視頻內容附加標簽的系統，包括檢測模塊和標簽模塊，其檢測模塊進一步包括：分割模塊，用于將所述音頻或視頻的聲音信號按預定時間長度A分割為幀；元音分析模塊，用于分析每幀聲音信號是否包含元音；人聲判斷模塊，用于依據預定時間長度B內包含元音的聲音信號的幀的數量判斷人聲。所述元音判斷模塊進一步包括：傅里葉變換模塊，用于將每幀聲音信號從時域由傅里葉變換變換到頻域；元音比對模塊，用于將每幀聲音信號變換到頻域后的頻譜特性與元音的頻譜特性進行比對，判斷其是否包含元音。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及一種對音頻或視頻內容檢測并附加標簽的方法和系統。本專利技術主要涉及語音模式檢測領域，具體內容為語音標簽的創建、嵌入、存儲、回放、定位等。本專利技術涉及對人的聲音的檢測，本專利技術涉及在訊問、詢問環境下的聲音檢測。本專利技術的方法和系統主要應用在公安、檢察院、法院對犯罪嫌疑人、被告人進行訊問，對證人進行詢問，以及庭審的全程同步錄音錄像內容審查，也可用于其它音視頻文件的審查。
技術介紹
語音檢測技術，主要是指在音頻數據中檢測到特定對象的聲音，區別于其他對象。語音檢測領域所涉及到的技術有信號處理、模式識別、概率論、信息論、人工智能。語音檢測技術包括：特征提取技術，模式匹配準則以及模型訓練技術三個方面。隨著信息
的科技發展，預計未來幾年語音檢測技術將進入軍事、審訊、庭審、通信、電子醫療、家庭服務、消費電子產品等各個領域。語音檢測領域前景廣闊，通過與其他技術的結合，可以應用于更加復雜的場景。隨著社會經濟發展，犯罪形式愈發朝著多樣化、復雜化、科技化、隱秘化的方向發展，使得查辦案件難度加大，需要辦案人員反復進行案情分析。其中訊問全程的同步錄音錄像，可以回溯再現訊問當時的情境，能夠重現犯
罪嫌疑人在訊問中陳述的內容以及說話時的面部表情和精神狀態，是偵查部門進行事后案情分析重要的線索來源。此外，偵監和公訴部門進行案件監督審查時，需要全程回放案件的錄音錄像進行審查是否有刑訊逼供、指供、誘供等非法行為發生。但是，由于辦案審訊時間通常較長，很大部分錄像是沒有審訊聲音的無用錄像，實際案件的全程同步錄音錄像往往持續數個小時，若全程回放案件的錄音錄...

【技術保護點】
一種對音頻或視頻內容附加標簽的方法，其特征在于，包括以下步驟：對音頻或視頻進行人聲檢測并獲得檢測結果；依據檢測結果對音頻或視頻附加標簽，所述附加標簽包括對判斷為人聲的音頻或視頻的部分附加人聲標簽，或對判斷為一個或多個自然人的音頻或視頻的部分附加與所述一個或多個自然人對應的標簽，所述附加標簽為自動附加或依據人的操作附加相應標簽。

【技術特征摘要】
1.一種對音頻或視頻內容附加標簽的方法，其特征在于，包括以下步驟：對音頻或視頻進行人聲檢測并獲得檢測結果；依據檢測結果對音頻或視頻附加標簽，所述附加標簽包括對判斷為人聲的音頻或視頻的部分附加人聲標簽，或對判斷為一個或多個自然人的音頻或視頻的部分附加與所述一個或多個自然人對應的標簽，所述附加標簽為自動附加或依據人的操作附加相應標簽。2.如權利要求1所述一種對音頻或視頻內容附加標簽的方法，其特征在于，所述對音頻或視頻進行人聲檢測并或得檢測結果的步驟進一步包括以下步驟：將所述音頻或視頻的聲音信號按預定時間長度A分割為幀；分析每幀聲音信號是否包含元音；依據預定時間長度B內包含元音的聲音信號的幀的數量判斷人聲。3.如權利要求2所述一種對音頻或視頻內容附加標簽的方法，其特征在于，所述預定時間長度A為40毫秒。4.如權利要求2-3所述一種對音頻或視頻內容附加標簽的方法，其特征在于，所述預定時間長度B為1秒；若所述預定時間長度內包含元音的聲音信號的幀的數量大于9幀，則判斷相應音頻或視頻包含人的語音。5.如權利要求2-4所述一種對音頻或視頻內容附加標簽的方法，其特征在于，所述分析每幀聲音信號是否包含元音的步驟進一步包括以下步驟：將每幀聲音信號從時域由傅里葉變換變換到頻域；將每幀聲音信號變換到頻域后的頻譜特性與元音的頻譜特性進行比對，判斷其是否包含元音。6.如權利要求5所述一種對音頻或視頻內容附加標簽的方法，其特征在于，所述將每幀聲音信號變換到頻域后的頻譜特性與元音的頻譜特性進行比對，判斷其是否包含元音，依據包括：元音的頻率范圍200HZ-8000HZ和/或元音有共振峰特性。7.如權利要求1所述一種對音頻或視頻內容附加標簽的方法，其特征在于，所述對音頻或視頻進行人聲檢測并或得檢測結果的步驟進一步包括以下步驟：將所述音頻或視頻的聲音信...

【專利技術屬性】
技術研發人員：王磊，
申請(專利權)人：王磊，
類型：發明
國別省市：天津;12

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術

音視頻測試方法技術

視頻和音頻同步的方法技術

音頻標簽技術