System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及音頻降噪,具體而言,本申請涉及一種音頻降噪方法、設備、介質及產品。
技術介紹
1、終端設備采集到的音頻信號通常都帶有噪聲,在對音頻信號做進一步處理時,通常需要對其進行語音降噪。語音降噪是針對噪聲問題的一種有效的處理技術,它的目的就是為了消除噪聲的影響,提高語音清晰度、改善語音的質量。
2、例如,在語音通話的過程中,終端采集到的音頻信號可能帶有環境噪聲、他人說話聲等,終端在對音頻信號進行編碼傳輸前,通常需要對音頻信號進行語音降噪處理,得到純凈語音信號。純凈語音信號是指消除音頻信號中的噪聲信號之后得到的語音信號,純凈語音信號中不含噪聲,或者包含的噪聲在允許的誤差范圍內。
3、現有技術中通常采用降噪算法(例如,最小均方算法)對語音信號進行單次降噪處理。然而,現有的降噪方法無法準確分離噪聲信號,通過現有的降噪方法進行降噪處理后得到的音頻信號中仍然存在較多的噪聲,降噪效果不好。
技術實現思路
1、本申請實施例提供了一種音頻降噪方法、設備、介質及產品,可以解決現有音頻信號降噪處理后仍存在較多噪聲,降噪效果差的問題。為了實現該目的,本申請實施例提供了如下幾個方案。
2、根據本申請實施例的一個方面,提供了一種音頻降噪方法,包括:
3、獲取原始音頻信號對應的時頻圖,將所述時頻圖輸入預設模型,得到第一噪聲識別結果,所述預設模型是基于不同類別噪聲的時頻圖使用第一卷積神經網絡訓練得到的;
4、根據所述第一噪聲識別結果進行降噪處理得到所述
5、利用自適應濾波器以及第二卷積神經網絡對所述第一音頻信號降噪處理,得到目標音頻信號。
6、在一個可能的實現方式中,所述獲取原始音頻信號對應的時頻圖,包括:
7、對所述原始音頻信號增強處理,得到第二音頻信號,所述增強處理包括延遲回聲、混響、和聲鑲邊、音調調高調低以及同類噪聲混合中的一種或多種;
8、預處理所述第二音頻信號,得到待分析音頻信號,所述預處理包括重采樣、預加重、分幀、加窗中的至少一種;
9、獲取所述待分析音頻信號的時頻圖。
10、在一個可能的實現方式中,所述預處理包括重采樣和預加重,所述預處理所述第二音頻信號,包括:
11、基于預設采樣率對增強處理后的所述第二音頻信號進行重采樣;
12、使用預設數量的一階高通濾波器對重采樣后的所述第二音頻信號進行預加重處理。
13、在一個可能的實現方式中,所述預處理包括分幀和加窗,所述預處理所述第二音頻信號,包括:
14、根據所述第二音頻信號的音頻變化特征確定切分單位和步進偏移;
15、基于所述切分單位和所述步進偏移處理所述第二音頻信號;
16、獲取處理后的所述第二音頻信號對應的窗函數,基于所述窗函數對處理后的所述第二音頻信號加窗處理。
17、在一個可能的實現方式中,所述預設模型的獲取,包括:
18、獲取不同類別噪聲的時頻圖;
19、將所述時頻圖確定為訓練樣本,基于所述訓練樣本和第一卷積神經網絡進行模型訓練,得到所述預設模型,所述第一卷積神經網絡包括resnet50殘差卷積神經網絡,所述resnet50殘差卷積神經網絡的卷積層包括類型為可變性卷積的卷積塊。
20、在一個可能的實現方式中,所述利用自適應濾波器以及第二卷積神經網絡對所述第一音頻信號降噪處理,包括:
21、通過自適應濾波器處理所述第一音頻信號,并根據所述自適應濾波器的實際輸出與期望輸出的誤差更新所述自適應濾波器的系數;
22、將所述自適應濾波器輸出的信號序列輸入所述第二卷積神經網絡對應的降噪模型,得到所述降噪模型輸出的降噪結果。
23、在一個可能的實現方式中,所述通過自適應濾波器處理所述第一音頻信號,包括:
24、獲取回聲輸出信號以及對應的回聲信號,所述回聲輸出信號采集于音響播放時;
25、將所述回聲輸出信號以及所述回聲信號輸入預設預測模型,得到回聲預測信號,所述預設預測模型包括kriging插值模型;
26、將所述回聲預測信號輸入所述自適應濾波器進行回聲降噪處理。
27、根據本申請實施例的一個方面,提供一種電子設備,包括存儲器、處理器及存儲在存儲器上的計算機程序,所述處理器執行所述計算機程序以實現如上所述方法的步驟。
28、根據本申請實施例的一個方面,提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如上所述方法的步驟。
29、根據本申請實施例的一個方面,提供一種計算機程序產品,包括計算機程序,所述計算機程序被處理器執行時實現如上所述方法的步驟。
30、本申請實施例提供的技術方案帶來的有益效果是:
31、本申請提供的音頻降噪方法獲取原始音頻信號對應的時頻圖,將時頻圖輸入基于不同類別噪聲的時頻圖使用第一卷積神經網絡訓練得到的預設模型,得到第一噪聲識別結果;根據第一噪聲識別結果進行降噪處理得到原始音頻信號對應的第一音頻信號;利用自適應濾波器以及第二卷積神經網絡對第一音頻信號降噪處理,得到目標音頻信號,本申請實施例能夠通過時頻圖將音頻信號轉換為圖像信號,利用該圖像信號進行初步降噪處理,并將自適應濾波器與卷積神經網絡結合,進一步去除音頻信號中的噪聲,通過雙重降噪處理的方式有效提升噪聲信號分離的準確性,降低音頻信號中噪聲的數量和影響,大幅提升降噪效果,提升用戶的使用體驗。
本文檔來自技高網...【技術保護點】
1.一種音頻降噪方法,其特征在于,包括:
2.根據權利要求1所述的音頻降噪方法,其特征在于,所述獲取原始音頻信號對應的時頻圖,包括:
3.根據權利要求2所述的音頻降噪方法,其特征在于,所述預處理包括重采樣和預加重,所述預處理所述第二音頻信號,包括:
4.根據權利要求2所述的音頻降噪方法,其特征在于,所述預處理包括分幀和加窗,所述預處理所述第二音頻信號,包括:
5.根據權利要求1所述的音頻降噪方法,其特征在于,所述預設模型的獲取,包括:
6.根據權利要求1所述的音頻降噪方法,其特征在于,所述利用自適應濾波器以及第二卷積神經網絡對所述第一音頻信號降噪處理,包括:
7.根據權利要求6所述的音頻降噪方法,其特征在于,所述通過自適應濾波器處理所述第一音頻信號,包括:
8.一種電子設備,包括存儲器、處理器及存儲在存儲器上的計算機程序,其特征在于,所述處理器執行所述計算機程序以實現權利要求1-7中任一項所述方法的步驟。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處
10.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1-7任一項所述方法的步驟。
...【技術特征摘要】
1.一種音頻降噪方法,其特征在于,包括:
2.根據權利要求1所述的音頻降噪方法,其特征在于,所述獲取原始音頻信號對應的時頻圖,包括:
3.根據權利要求2所述的音頻降噪方法,其特征在于,所述預處理包括重采樣和預加重,所述預處理所述第二音頻信號,包括:
4.根據權利要求2所述的音頻降噪方法,其特征在于,所述預處理包括分幀和加窗,所述預處理所述第二音頻信號,包括:
5.根據權利要求1所述的音頻降噪方法,其特征在于,所述預設模型的獲取,包括:
6.根據權利要求1所述的音頻降噪方法,其特征在于,所述利用自適應濾波器以及第二卷積神經網絡...
【專利技術屬性】
技術研發人員:彭欣瞳,謝達裕,單銳杰,黃小強,張常華,
申請(專利權)人:廣東保倫電子股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。