• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    降噪模型訓練方法、裝置以及設備制造方法及圖紙

    技術編號:36538300 閱讀:23 留言:0更新日期:2023-02-01 16:29
    本公開提供了一種降噪模型訓練方法、裝置以及設備,涉及人工智能技術領域,具體涉及自然語言處理和深度學習等技術領域。該方法的一具體實施方式包括:獲取樣本帶噪語音信號;提取樣本帶噪語音信號的樣本頻域特征;計算樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比;將樣本頻域特征作為輸入,將樣本目標頻帶增益和樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型。該實施方式訓練出的降噪模型具有較好的降噪性能。練出的降噪模型具有較好的降噪性能。練出的降噪模型具有較好的降噪性能。

    【技術實現步驟摘要】
    降噪模型訓練方法、裝置以及設備


    [0001]本公開涉及人工智能
    ,具體涉及自然語言處理和深度學習等


    技術介紹

    [0002]實時語音通話能夠為人們的生活與工作帶來極大的方便。但隨著科技與生活不斷地發展,人們對語音通話的質量要求也越來越高。面對各種嘈雜的產品應用環境,語音降噪技術突顯出無可取代的地位,其能夠抑制語音信號中的背景噪聲,提高語音的清晰度與可懂度,進而提高語音交互質量與效率。而在實時通話中,其噪聲抑制能力和實時運行能力更是起著至關重要的作用。
    [0003]目前,利用譜減法、自適應濾波器降噪等經典降噪算法進行語音降噪。

    技術實現思路

    [0004]本公開實施例提出了一種降噪模型訓練方法、裝置、設備、存儲介質以及程序產品。
    [0005]第一方面,本公開實施例提出了一種降噪模型訓練方法,包括:獲取樣本帶噪語音信號;提取樣本帶噪語音信號的樣本頻域特征;計算樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比;將樣本頻域特征作為輸入,將樣本目標頻帶增益和樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型。
    [0006]第二方面,本公開實施例提出了一種語音降噪方法,包括:獲取帶噪語音信號;提取帶噪語音信號的頻域特征;將頻域特征輸入至降噪模型,得到M個頻帶增益,其中,M為正整數,降噪模型是采用第一方面所述的方法訓練得到的;基于M個頻帶增益進行降噪,得到干凈語音信號。
    [0007]第三方面,本公開實施例提出了一種降噪模型訓練裝置,包括:獲取模塊,被配置成獲取樣本帶噪語音信號;提取模塊,被配置成提取樣本帶噪語音信號的樣本頻域特征;計算模塊,被配置成計算樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比;訓練模塊,被配置成將樣本頻域特征作為輸入,將樣本目標頻帶增益和樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型。
    [0008]第四方面,本公開實施例提出了一種語音降噪裝置,包括:獲取模塊,被配置成獲取帶噪語音信號;提取模塊,被配置成提取帶噪語音信號的頻域特征;輸入模塊,被配置成將頻域特征輸入至降噪模型,得到M個頻帶增益,其中,M為正整數,降噪模型是采用第三方面所述的裝置訓練得到的;降噪模塊,被配置成基于M個頻帶增益進行降噪,得到干凈語音信號。
    [0009]第五方面,本公開實施例提出了一種電子設備,包括:至少兩個處理器;以及與至少兩個處理器通信連接的存儲器;其中,存儲器存儲有可被至少兩個處理器執行的指令,指令被至少兩個處理器執行,以使至少兩個處理器能夠執行如第一方面中任一實現方式描述的方法或第二方面中任一實現方式描述的方法。
    [0010]第六方面,本公開實施例提出了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,計算機指令用于使計算機執行如第一方面中任一實現方式描述的方法或第二方面中任一實現方式描述的方法。
    [0011]第七方面,本公開實施例提出了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現如第一方面中任一實現方式描述的方法或第二方面中任一實現方式描述的方法。
    [0012]本公開實施例提供的降噪模型訓練方法,訓練出的降噪模型具有較好的降噪性能與實時性能,對平穩噪聲與非平穩噪聲均有較好的抑制能力。
    [0013]應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
    附圖說明
    [0014]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本公開的其它特征、目的和優點將會變得更明顯。附圖用于更好地理解本方案,不構成對本公開的限定。其中:
    [0015]圖1是根據本公開的降噪模型訓練方法的一個實施例的流程圖;
    [0016]圖2是根據本公開的降噪模型訓練方法的又一個實施例的流程圖;
    [0017]圖3是圖2中的降噪模型訓練方法中的訓練特征的示意圖;
    [0018]圖4是圖2中的降噪模型訓練方法中的降噪模型的網絡結構圖;
    [0019]圖5是根據本公開的語音降噪方法的一個實施例的流程圖;
    [0020]圖6是根據本公開的語音降噪方法的又一個實施例的流程圖;
    [0021]圖7是圖6中的語音降噪方法的流程框圖;
    [0022]圖8是一個降噪效果示意圖;
    [0023]圖9是又一個降噪效果示意圖;
    [0024]圖10是可以實現本公開實施例的降噪模型訓練方法和語音降噪方法的場景圖;
    [0025]圖11是根據本公開的降噪模型訓練裝置的一個實施例的結構示意圖;
    [0026]圖12是根據本公開的語音降噪裝置的一個實施例的結構示意圖;
    [0027]圖13是用來實現本公開實施例的降噪模型訓練方法和語音降噪方法的電子設備的框圖。
    具體實施方式
    [0028]以下結合附圖對本公開的示范性實施例做出說明,其中包括本公開實施例的各種細節以助于理解,應當將它們認為僅僅是示范性的。因此,本領域普通技術人員應當認識到,可以對這里描述的實施例做出各種改變和修改,而不會背離本公開的范圍和精神。同樣,為了清楚和簡明,以下的描述中省略了對公知功能和結構的描述。
    [0029]需要說明的是,在不沖突的情況下,本公開中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本公開。
    [0030]圖1示出了根據本公開的降噪模型訓練方法的一個實施例的流程100。該降噪模型訓練方法包括以下步驟:
    [0031]步驟101,獲取樣本帶噪語音信號。
    [0032]在本實施例中,降噪模型訓練方法的執行主體可以獲取樣本帶噪語音信號。其中,樣本帶噪語音信號是帶有噪聲的語音信號,可以是在嘈雜的環境下采集的語音信號,也可以由干凈語音信號與噪聲信號融合而得到。
    [0033]步驟102,提取樣本帶噪語音信號的樣本頻域特征。
    [0034]在本實施例中,上述執行主體可以提取樣本帶噪語音信號的樣本頻域特征。其中,樣本頻域特征可以包括但不限于:ERB(Equivalent Rectangular Bandwidth,等效矩形帶寬)倒譜系數、ERB倒譜系數的一階差分與二階差分,以及語音基音相關度的DCT(Discrete Cosine Transform,離散余弦變換)系數與基音周期等等。
    [0035]這里,樣本帶噪語音信號通常是時域信號,需要將其轉換到頻域,才能提取頻域特征。具體地,將樣本帶噪語音信號轉換到頻域,得到樣本頻域帶噪語音信號;從樣本頻域帶噪語音信號中提取樣本頻域特征。
    [0036]步驟103,計算樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比。
    [0037]在本實施例中,上述執行主體可以計算樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比。其中,基于樣本帶噪語音信號與其對應的樣本干凈語音信號可以計算樣本目標頻帶增益和樣本目標時域能量比。
    [0038]步驟104,將樣本本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種降噪模型訓練方法,包括:獲取樣本帶噪語音信號;提取所述樣本帶噪語音信號的樣本頻域特征;計算所述樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比;將所述樣本頻域特征作為輸入,將所述樣本目標頻帶增益和所述樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型。2.根據權利要求1所述的方法,其中,所述提取所述樣本帶噪語音信號的樣本頻域特征,包括:將所述樣本帶噪語音信號轉換到頻域,得到樣本頻域帶噪語音信號;從所述樣本頻域帶噪語音信號中提取所述樣本頻域特征。3.根據權利要求2所述的方法,其中,所述從所述樣本頻域帶噪語音信號中提取所述樣本頻域特征,包括:將所述樣本頻域帶噪語音信號轉換到等效矩形帶寬ERB域,得到樣本ERB域頻點;將所述樣本ERB域頻點劃分為M個樣本ERB域子帶,其中,M為正整數;將所述M個樣本ERB域子帶轉換到頻域,得到M個樣本頻域子帶;分別對所述M個樣本頻域子帶的對數能量和進行離散余弦變換DCT,得到M個樣本DCT系數。4.根據權利要求3所述的方法,其中,所述從所述樣本頻域帶噪語音信號中提取所述樣本頻域特征,還包括:分別計算所述M個樣本DCT系數中前N個樣本DCT系數的一階差分和二階差分,其中,N為正整數,且N≤M。5.根據權利要求2
    ?
    4中任一項所述的方法,其中,所述從所述樣本頻域帶噪語音信號中提取所述樣本頻域特征,還包括:計算所述樣本頻域帶噪語音信號的語音基音相關度的P維DCT系數與基音周期,其中,P為正整數。6.根據權利要求2所述的方法,其中,所述獲取樣本帶噪語音信號,包括:獲取樣本干凈語音信號和樣本噪聲信號;將所述樣本干凈語音信號與所述樣本噪聲信號融合,得到所述樣本帶噪語音信號;以及所述計算所述樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比,包括:基于所述樣本干凈語音信號的M個樣本頻域子帶和所述樣本帶噪語音信號的M個樣本頻域子帶,計算所述樣本目標頻帶增益;基于所述樣本干凈語音信號和所述樣本帶噪語音信號,計算所述樣本目標時域能量比。7.根據權利要求1
    ?
    6中任一項所述的方法,其中,所述將所述樣本頻域特征作為輸入,將所述樣本目標頻帶增益和所述樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型,包括:將所述樣本頻域特征輸入至所述網絡,學習得到樣本預測頻帶增益和樣本預測時域能量比;
    基于所述樣本目標頻帶增益和所述樣本預測頻帶增益,計算第一損失函數;基于所述樣本目標時域能量比和所述樣本預測時域能量比,計算第二損失函數;基于所述第一損失函數和所述第二損失函數,調整所述網絡的參數,得到所述降噪模型。8.一種語音降噪方法,包括:獲取帶噪語音信號;提取所述帶噪語音信號的頻域特征;將所述頻域特征輸入至降噪模型,得到M個頻帶增益,其中,M為正整數,所述降噪模型是采用權利要求1
    ?
    7中任一項所述的方法訓練得到的;基于所述M個頻帶增益進行降噪,得到干凈語音信號。9.根據權利要求8所述的方法,其中,所述提取所述帶噪語音信號的頻域特征,包括:將所述帶噪語音信號轉換到頻域,得到頻域帶噪語音信號;從所述頻域帶噪語音信號中提取所述頻域特征;以及所述基于所述M個頻帶增益進行降噪,得到干凈語音信號,包括:對所述M個頻帶增益進行插值,以及對插值后的頻帶增益的頻點進行加權,得到頻域干凈語音信號;將所述頻域干凈語音信號轉換到時域,得到所述干凈語音信號。10.一種降噪模型訓練裝置,包括:獲取模塊,被配置成獲取樣本帶噪語音信號;提取模塊,被配置成提取所述樣本帶噪語音信號的樣本頻域特征;計算模塊,被配置成計算所述樣本帶噪語音信號的樣本目標頻帶增益和樣本目標時域能量比;訓練模塊,被配置成將所述樣本頻域特征作為輸入,將所述樣本目標頻帶增益和所述樣本目標時域能量比作為監督,對網絡進行訓練,得到降噪模型。11.根據權利要求10所述的裝置,其中,所...

    【專利技術屬性】
    技術研發人員:梁龍騰李偉南黃傳輝
    申請(專利權)人:上海小度技術有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产精品无码aⅴ嫩草| 无码国产69精品久久久久网站| 高清无码v视频日本www| 99久无码中文字幕一本久道| 国产做无码视频在线观看| 亚洲av无码片在线播放| 丰满少妇被猛烈进入无码| 无码欧精品亚洲日韩一区| 九九久久精品无码专区| 无码人妻精品一区二区蜜桃网站| 亚洲乱亚洲乱少妇无码| 亚洲AV无码AV吞精久久| 水蜜桃av无码一区二区| 亚洲精品无码久久久| 亚洲中文字幕无码久久2020| 免费无码av片在线观看 | 亚洲精品国产日韩无码AV永久免费网 | 无码人妻精品中文字幕| 亚洲一级Av无码毛片久久精品 | 国产乱人伦中文无无码视频试看 | 无码国产色欲XXXXX视频| 无码人妻一区二区三区免费视频 | 色综合久久久无码中文字幕| 亚洲AV无码成人精品区蜜桃| 国产aⅴ激情无码久久| 亚洲一区二区三区无码影院| 特级毛片内射www无码| 毛片一区二区三区无码| 亚洲中文字幕无码中文| 亚洲精品中文字幕无码A片老| 久久午夜伦鲁片免费无码| 少妇无码一区二区三区| 久久精品aⅴ无码中文字字幕不卡| 亚洲中文字幕无码一区二区三区| AV无码小缝喷白浆在线观看 | 国产成人无码久久久精品一| 亚洲日韩中文无码久久| 熟妇人妻无码中文字幕| 91久久精品无码一区二区毛片| 久久久无码精品亚洲日韩按摩| 久久AV高潮AV无码AV|