一種基于動態噪聲估計時頻域自適應語音檢測方法技術

技術編號：13986803 閱讀：108 留言：0更新日期：2016-11-13 04:06

本發明專利技術涉及信息處理技術及傳感信號處理領域，特別是涉及到一種基于動態噪聲估計時頻域自適應自動語音檢測方法，本發明專利技術根據聲音的時域短時能量和一定范圍頻域短時能量變化分別進行語音的檢測，最后根據動態估計出的背景噪聲能量的大小，選擇最優的結果，從而大幅提高了語音識別的準確率并提高了語音識別對環境變化的適應性。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及信息處理技術及傳感信號處理領域，特別是涉及到一種基于動態噪聲估計時頻域自適應語音檢測方法。
技術介紹
人工智能應用領域的一個熱點就是語音識別，目前語音識別已經開始在各個領域廣泛應用。語音檢測的實現是語音識別系統實時實現的重要部分，其目的是在復雜的實際環境中區分語音段與非語音段。有文獻表明，實際應用中識別率較低部分很大程度是由于未對語音進行正確處理，大量的非語音信息嚴重影響了語音識別系統的準確率，特別是應用環境帶有大量噪聲的語音識別，正確的語音檢測技術可有效地降低系統運算量，縮短系統處理時間，減少移動端發射功率并節省信道資源，提高語音識別準確率，尤其是在復雜背景噪聲下，語音識別系統性能的優劣在很大程度上取決于語音檢測技術的優劣，因此穩健、精確、實時、自適應性強及魯棒性好的語音檢測技術是每個語音識別系統所必需的。目前語音識別技術在移動端尤其是手機或語音遙控器上應用時，主要依靠按鍵方式決定語音的起始和結束，然而這種方式對于大量遠講應用則非常不方便，對遠講或者是不拿在手上的支持語音識別的智能設備、機器人而言，自動語音檢測系統就是必不可少的部件。當前自動語音檢測的主流方法是依靠時域中短時能量大小，過零率大小，以及頻域中頻帶能量均方差三種方法來檢測，具體方法式求出短時能量、過零率或者頻帶能量均方差，然后與一個經驗閾值進行比較，實驗證明，這種單獨比較短時能量大小或過零率大小的方法對于有噪聲的環境適應性不好，尤其是當應用環境發生變化時，同一環境的背景噪聲也會發生相應的變化，而頻帶能量均方差方法對于安靜環境也適應不好。為解決上述問題，需要專利技術一種根據時域...

【技術保護點】
一種基于動態噪聲估計時頻域自適應語音檢測方法，其包括以下步驟：步驟一，載入當前幀數據，所述當前幀數據為時域內語音數據；步驟二，計算所述時域內語音數據的每幀聲音的能量總和作為時域短時能量，并將每幀所述時域內語音數據通過FFT變換為頻域數據；步驟三，選取所述頻域數據一定頻率范圍子帶數據，計算所述一定頻率范圍子帶數據的能量并累加作為頻域短時能量；步驟四，背景噪聲能量估計單元計算出背景噪聲能量，頻域背景能量計算單元計算出頻域背景能量；步驟五，將所述時域短時能量與所述背景噪聲能量進行比較，結果為大于所述背景噪聲能量的則為語音，結果為小于或等于所述背景噪聲能量的則為非語音；步驟六，將所述頻域短時能量與所述頻域背景能量進行比較，結果為大于所述頻域背景能量的則為語音，結果為小于或等于所述頻域背景能量的則為非語音；步驟七，將所述背景噪聲能量與一系統設定的閾值一進行比較，若大于閾值一則選擇步驟六中比較為語音的結果，若小于等于閾值一則選擇步驟五中比較為語音的結果；步驟八，若所述當前幀結果檢測為非語音，則將所述當前幀的所述時域短時能量送到所述背景噪聲估計單元中累加，累加到第一幀數后，將累加值除以所述第一幀數得...

【技術特征摘要】
1.一種基于動態噪聲估計時頻域自適應語音檢測方法，其包括以下步驟：步驟一，載入當前幀數據，所述當前幀數據為時域內語音數據；步驟二，計算所述時域內語音數據的每幀聲音的能量總和作為時域短時能量，并將每幀所述時域內語音數據通過FFT變換為頻域數據；步驟三，選取所述頻域數據一定頻率范圍子帶數據，計算所述一定頻率范圍子帶數據的能量并累加作為頻域短時能量；步驟四，背景噪聲能量估計單元計算出背景噪聲能量，頻域背景能量計算單元計算出頻域背景能量；步驟五，將所述時域短時能量與所述背景噪聲能量進行比較，結果為大于所述背景噪聲能量的則為語音，結果為小于或等于所述背景噪聲能量的則為非語音；步驟六，將所述頻域短時能量與所述頻域背景能量進行比較，結果為大于所述頻域背景能量的則為語音，結果為小于或等于所述頻域背景能量的則為非語音；步驟七，將所述背景噪聲能量與一系統設定的閾值一進行比較，若大于閾值一則選擇步驟六中比較為語音的結果，若小于等于閾值一則選擇步驟五中比較為語音的結果；步驟八，若所述當前幀結果檢測為非語音，則將所述當前幀的所述時域短時能量送到所述背景噪聲估計單元中累加，累加到第一幀數后，將累加值除以所述第一幀數得到新的背景噪聲能量作為輸出，同時將所述當前幀的所述頻域短時能量送到所述頻域背景能量計算單元中累加，累加到第二幀數后，將累加值除以所述第二幀數得到新的頻域背景能量作為輸出。2.根據權利要求1所述的基于動態噪聲估計時頻域自適應語音檢測方法，其特征在于：步驟五中所述時域短時能量與所述背景噪聲能量進行比較的方法是用所述時域短時能量減去所述背景噪聲能量的差值與系統設定...

【專利技術屬性】
技術研發人員：何云鵬，
申請(專利權)人：成都啟英泰倫科技有限公司，
類型：發明
國別省市：四川;51

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術