當(dāng)前位置: 首頁 > 專利查詢>騰訊音樂娛樂科技深圳有限公司專利>正文

音頻處理方法、裝置及存儲介質(zhì)制造方法及圖紙

技術(shù)編號：25839815 閱讀：33 留言：0更新日期：2020-10-02 14:19

本發(fā)明專利技術(shù)實施例公開了一種音頻處理方法、裝置及存儲介質(zhì)。該方案可以獲取待處理音頻信號，待處理音頻信號包括截幅失真部分，獲取預(yù)先訓(xùn)練完成的目標(biāo)序列生成模型，其中目標(biāo)序列生成模型為對失真音頻信號樣本訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型，且目標(biāo)序列生成模型包括非因果膨脹卷積層，將待處理音頻信號輸入至目標(biāo)序列生成模型，以使非因果膨脹卷積層依據(jù)截幅失真部分前后的音頻信號對截幅失真部分進行修復(fù)，得到修復(fù)后的音頻信號。本申請實施例所提供的方案可以針對待修復(fù)的截幅失真的音頻，通過預(yù)測模型進行音頻信號修復(fù)，從而提升音頻音質(zhì)。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實現(xiàn)步驟摘要】
音頻處理方法、裝置及存儲介質(zhì)
本專利技術(shù)涉及數(shù)據(jù)處理
，具體涉及一種音頻處理方法、裝置及存儲介質(zhì)。
技術(shù)介紹
隨著Internet技術(shù)不斷發(fā)展，如短視頻，直播平臺的興起，個人制作的音頻信號得到更多的傳播，而這些音頻由于錄制環(huán)境，設(shè)備等，較容易產(chǎn)生截幅失真的現(xiàn)象。原因是由于電路和音響單元對輸入的音頻信號的幅度有限制，在通過硬件電路錄制音頻的過程中，需要將音頻信號的最大幅度限制在電路和音響單元的允許范圍內(nèi)。因此，當(dāng)音頻數(shù)據(jù)的幅度超過電路和音響單元的允許范圍時，將會產(chǎn)生截幅失真，所造成的失真損害了音頻的音質(zhì)。在現(xiàn)有的技術(shù)當(dāng)中，傳統(tǒng)的音頻截幅失真修復(fù)方法重點放在音頻信號處理上，如利用曲線擬合，基于AR(AutoRegressive，自回歸)模型以及最小均方誤差的算法，此種修復(fù)方法存在以下的一些局限性。比如截幅失真持續(xù)時間較小時效果較好，若持續(xù)時間較長，其效果不是很理想，并且對語音音頻的處理效果較好，但對音樂來說則效果較差。
技術(shù)實現(xiàn)思路
本專利技術(shù)實施例提供一種音頻處理方法、裝置及存儲介質(zhì)，可以針對待修復(fù)的截幅失真的音頻，通過預(yù)測模型進行音頻信號修復(fù)，從而提升音頻音質(zhì)。本專利技術(shù)實施例提供一種音頻處理方法，包括：獲取待處理音頻信號，所述待處理音頻信號包括截幅失真部分；獲取預(yù)先訓(xùn)練完成的目標(biāo)序列生成模型，其中所述目標(biāo)序列生成模型為對失真音頻信號樣本訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型，且所述目標(biāo)序列生成模型包括非因果膨脹卷積層；將所述待處理音頻信號輸入至所述目標(biāo)序列生成模型，...

【技術(shù)保護點】
1.一種音頻處理方法，其特征在于，包括：/n獲取待處理音頻信號，所述待處理音頻信號包括截幅失真部分；/n獲取預(yù)先訓(xùn)練完成的目標(biāo)序列生成模型，其中所述目標(biāo)序列生成模型為對失真音頻信號樣本訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型，且所述目標(biāo)序列生成模型包括非因果膨脹卷積層；/n將所述待處理音頻信號輸入至所述目標(biāo)序列生成模型，以使所述非因果膨脹卷積層依據(jù)所述截幅失真部分前后的音頻信號對所述截幅失真部分進行修復(fù)，得到修復(fù)后的音頻信號。/n

【技術(shù)特征摘要】
1.一種音頻處理方法，其特征在于，包括：
獲取待處理音頻信號，所述待處理音頻信號包括截幅失真部分；
獲取預(yù)先訓(xùn)練完成的目標(biāo)序列生成模型，其中所述目標(biāo)序列生成模型為對失真音頻信號樣本訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)模型，且所述目標(biāo)序列生成模型包括非因果膨脹卷積層；
將所述待處理音頻信號輸入至所述目標(biāo)序列生成模型，以使所述非因果膨脹卷積層依據(jù)所述截幅失真部分前后的音頻信號對所述截幅失真部分進行修復(fù)，得到修復(fù)后的音頻信號。

2.如權(quán)利要求1所述的音頻處理方法，其特征在于，所述目標(biāo)序列生成模型的訓(xùn)練過程包括：
獲取原始音頻信號樣本，并對所述原始音頻信號樣本進行截幅失真處理得到失真音頻信號樣本；
獲得包括非因果膨脹卷積層的預(yù)設(shè)序列生成模型；
將所述失真音頻信號樣本輸入至所述預(yù)設(shè)序列生成模型，以使所述非因果膨脹卷積層依據(jù)所述失真音頻信號樣本中失真樣本點前后的音頻信號對所述失真樣本點進行修復(fù)，得到預(yù)測音頻信號樣本；
將所述預(yù)測音頻信號樣本與所述原始音頻信號樣本進行比對，依據(jù)比對結(jié)果調(diào)整所述預(yù)設(shè)序列生成模型的模型參數(shù)，以得到由調(diào)整后的模型參數(shù)所表示的目標(biāo)序列生成模型。

3.如權(quán)利要求2所述的音頻處理方法，其特征在于，對所述原始音頻信號樣本進行截幅失真處理得到失真音頻信號樣本的步驟，包括：
獲取所述原始音頻信號樣本的時域波形，并根據(jù)所述時域波形判斷所述原始音頻信號樣本是否存在截幅失真；
若不存在，則在所述原始音頻信號樣本當(dāng)中選取目標(biāo)幅值，以及根據(jù)所述目標(biāo)幅值生成失真樣本點，以得到失真音頻信號樣本。

4.如權(quán)利要求3所述的音頻處理方法，其特征在于，根據(jù)所述預(yù)設(shè)幅值生成失真樣本點的步驟，包括：
基于預(yù)設(shè)公式對所述原始音頻信號樣本中的預(yù)設(shè)幅值進行截幅失真處理，其中所述預(yù)設(shè)公式為：

其中，s(t)表示原始音頻信號樣本中的樣本點；M表示目標(biāo)幅值，且所述目標(biāo)幅值為所述原始音頻信號樣本s的最大幅值；β表示閾值。

5.如權(quán)利要求2所述的音頻處理方法，其特征在于，將所述預(yù)測音頻信號樣本與所述原始音頻信號樣本進行比對，依據(jù)比對結(jié)果調(diào)整所述預(yù)設(shè)序列生成模型的模型參數(shù)的步驟，包括：
計算所述預(yù)測音頻信號樣本與所述原始音頻信號樣本的最小均方...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：陳洲旋，
申請(專利權(quán))人：騰訊音樂娛樂科技深圳有限公司，
類型：發(fā)明
國別省市：廣東;44

全部詳細(xì)技術(shù)資料下載我是這個專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)