【技術實現步驟摘要】
降噪模型訓練方法、裝置以及設備
[0001]本公開涉及人工智能
,具體涉及自然語言處理和深度學習等
技術介紹
[0002]實時語音通話能夠為人們的生活與工作帶來極大的方便。但隨著科技與生活不斷地發展,人們對語音通話的質量要求也越來越高。面對各種嘈雜的產品應用環境,語音降噪技術突顯出無可取代的地位,其能夠抑制語音信號中的背景噪聲,提高語音的清晰度與可懂度,進而提高語音交互質量與效率。而在實時通話中,其噪聲抑制能力和實時運行能力更是起著至關重要的作用。
[0003]目前,利用譜減法、自適應濾波器降噪等經典降噪算法進行語音降噪。
技術實現思路
[0004]本公開實施例提出了一種降噪模型訓練方法、裝置、設備、存儲介質以及程序產品。
[0005]第一方面,本公開實施例提出了一種降噪模型訓練方法,包括:獲取樣本帶噪語音信號;提取樣本帶噪語音信號的樣本頻域特征;計算樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比;將樣本頻域特征作為輸入,將樣本目標頻帶增益和樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型。
[0006]第二方面,本公開實施例提出了一種語音降噪方法,包括:獲取帶噪語音信號;提取帶噪語音信號的頻域特征;將頻域特征輸入至降噪模型,得到M個頻帶增益,其中,M為正整數,降噪模型是采用第一方面所述的方法訓練得到的;基于M個頻帶增益進行降噪,得到干凈語音信號。
[0007]第三方面,本公開實施例提出了一種降噪模型訓練裝置,包括:獲取模塊,被配置成獲取 ...
【技術保護點】
【技術特征摘要】
1.一種降噪模型訓練方法,包括:獲取樣本帶噪語音信號;提取所述樣本帶噪語音信號的樣本頻域特征;計算所述樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比;將所述樣本頻域特征作為輸入,將所述樣本目標頻帶增益和所述樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型。2.根據權利要求1所述的方法,其中,所述提取所述樣本帶噪語音信號的樣本頻域特征,包括:將所述樣本帶噪語音信號轉換到頻域,得到樣本頻域帶噪語音信號;從所述樣本頻域帶噪語音信號中提取所述樣本頻域特征。3.根據權利要求2所述的方法,其中,所述從所述樣本頻域帶噪語音信號中提取所述樣本頻域特征,包括:將所述樣本頻域帶噪語音信號轉換到等效矩形帶寬ERB域,得到樣本ERB域頻點;將所述樣本ERB域頻點劃分為M個樣本ERB域子帶,其中,M為正整數;將所述M個樣本ERB域子帶轉換到頻域,得到M個樣本頻域子帶;分別對所述M個樣本頻域子帶的對數能量和進行離散余弦變換DCT,得到M個樣本DCT系數。4.根據權利要求3所述的方法,其中,所述從所述樣本頻域帶噪語音信號中提取所述樣本頻域特征,還包括:分別計算所述M個樣本DCT系數中前N個樣本DCT系數的一階差分和二階差分,其中,N為正整數,且N≤M。5.根據權利要求2
?
4中任一項所述的方法,其中,所述從所述樣本頻域帶噪語音信號中提取所述樣本頻域特征,還包括:計算所述樣本頻域帶噪語音信號的語音基音相關度的P維DCT系數與基音周期,其中,P為正整數。6.根據權利要求2所述的方法,其中,所述獲取樣本帶噪語音信號,包括:獲取樣本干凈語音信號和樣本噪聲信號;將所述樣本干凈語音信號與所述樣本噪聲信號融合,得到所述樣本帶噪語音信號;以及所述計算所述樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比,包括:基于所述樣本干凈語音信號的M個樣本頻域子帶和所述樣本帶噪語音信號的M個樣本頻域子帶,計算所述樣本目標頻帶增益;基于所述樣本干凈語音信號和所述樣本帶噪語音信號,計算所述樣本目標時域能量比。7.根據權利要求1
?
6中任一項所述的方法,其中,所述將所述樣本頻域特征作為輸入,將所述樣本目標頻帶增益和所述樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型,包括:將所述樣本頻域特征輸入至所述網絡,學習得到樣本預測頻帶增益和樣本預測時域能量比;
基于所述樣本目標頻帶增益和所述樣本預測頻帶增益,計算第一損失函數;基于所述樣本目標時域能量比和所述樣本預測時域能量比,計算第二損失函數;基于所述第一損失函數和所述第二損失函數,調整所述網絡的參數,得到所述降噪模型。8.一種語音降噪方法,包括:獲取帶噪語音信號;提取所述帶噪語音信號的頻域特征;將所述頻域特征輸入至降噪模型,得到M個頻帶增益,其中,M為正整數,所述降噪模型是采用權利要求1
?
7中任一項所述的方法訓練得到的;基于所述M個頻帶增益進行降噪,得到干凈語音信號。9.根據權利要求8所述的方法,其中,所述提取所述帶噪語音信號的頻域特征,包括:將所述帶噪語音信號轉換到頻域,得到頻域帶噪語音信號;從所述頻域帶噪語音信號中提取所述頻域特征;以及所述基于所述M個頻帶增益進行降噪,得到干凈語音信號,包括:對所述M個頻帶增益進行插值,以及對插值后的頻帶增益的頻點進行加權,得到頻域干凈語音信號;將所述頻域干凈語音信號轉換到時域,得到所述干凈語音信號。10.一種降噪模型訓練裝置,包括:獲取模塊,被配置成獲取樣本帶噪語音信號;提取模塊,被配置成提取所述樣本帶噪語音信號的樣本頻域特征;計算模塊,被配置成計算所述樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比;訓練模塊,被配置成將所述樣本頻域特征作為輸入,將所述樣本目標頻帶增益和所述樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型。11.根據權利要求10所述的裝置,其中,所...
【專利技術屬性】
技術研發人員:梁龍騰,李偉南,黃傳輝,
申請(專利權)人:上海小度技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。