音頻解碼、編碼方法、裝置、電子設備及存儲介質制造方法及圖紙

技術編號：43964510 閱讀：43 留言：0更新日期：2025-01-07 21:50

本申請提供了一種音頻解碼、編碼方法、裝置、電子設備及存儲介質，可以應用于車載場景；音頻解碼方法包括：獲取碼流，其中，所述碼流是對音頻信號進行編碼得到的；對所述碼流進行解碼處理，得到所述音頻信號的特征向量的預測值；對所述特征向量的預測值進行標簽提取處理，得到用于信號增強的標簽信息向量，其中，所述標簽信息向量的維度與所述特征向量的預測值的維度相同；基于所述特征向量的預測值和所述標簽信息向量進行信號重建；將通過所述信號重建得到的所述音頻信號的預測值，作為所述碼流的解碼結果。通過本申請，能夠有效抑制音頻信號中的聲學干擾，進而提高重建得到的音頻信號的質量。

全部詳細技術資料下載

【技術實現步驟摘要】

本申請涉及通信，尤其涉及一種音頻解碼、編碼方法、裝置、電子設備及存儲介質。

技術介紹

1、由于語音通信的便利性和及時性，語音通話的應用越來越廣泛，例如在網絡會議的會議參與方之間傳輸音頻信號(例如語音信號)。而在語音通話中，語音信號可能會被混有噪聲等聲學干擾，語音信號中所混有的噪聲會導致通話質量變差，從而極大地影響了用戶的聽覺體驗。

2、然而，對于如何對語音信號進行增強處理以抑制噪聲部分，相關技術尚無有效的解決方案。

技術實現思路

1、本申請實施例提供一種音頻解碼、編碼方法、裝置、電子設備、計算機可讀存儲介質及計算機程序產品，能夠有效抑制音頻信號中的聲學干擾，進而提高重建得到的音頻信號的質量。

2、本申請實施例的技術方案是這樣實現的：

3、本申請實施例提供一種音頻解碼方法，包括：

4、獲取碼流，其中，所述碼流是對音頻信號進行編碼得到的；

5、對所述碼流進行解碼處理，得到所述音頻信號的特征向量的預測值；

6、對所述特征向量的預測值進行標簽提取處理，得到用于信號增強的標簽信息向量，其中，所述標簽信息向量的維度與所述特征向量的預測值的維度相同；

7、基于所述特征向量的預測值和所述標簽信息向量進行信號重建；

8、將通過所述信號重建得到的所述音頻信號的預測值，作為所述碼流的解碼結果。

9、本申請實施例提供一種音頻解碼裝置，包括：

10、獲取模塊，用于獲取碼流，其中，所述碼流是對音頻信號進行編碼得到的；

11、解碼模塊，用于對所述碼流進行解碼處理，得到所述音頻信號的特征向量的預測值；

12、標簽提取模塊，用于對所述特征向量的預測值進行標簽提取處理，得到用于信號增強的標簽信息向量，其中，所述標簽信息向量的維度與所述特征向量的預測值的維度相同；

13、重建模塊，用于基于所述特征向量的預測值和所述標簽信息向量進行信號重建；

14、確定模塊，用于將通過所述信號重建得到的所述音頻信號的預測值，作為所述碼流的解碼結果。

15、本申請實施例提供一種音頻編碼方法，包括：

16、獲取音頻信號；

17、對所述音頻信號進行編碼處理，得到碼流，其中，所述碼流用于供電子設備執行本申請實施例提供的音頻解碼方法。

18、本申請實施例提供一種音頻編碼裝置，包括：

19、獲取模塊，用于獲取音頻信號；

20、編碼模塊，用于對所述音頻信號進行編碼處理，得到碼流，其中，所述碼流用于供電子設備執行本申請實施例提供的音頻解碼方法。

21、本申請實施例提供一種電子設備，包括：

22、存儲器，用于存儲可執行指令；

23、處理器，用于執行所述存儲器中存儲的可執行指令時，實現本申請實施例提供的音頻編解碼方法。

24、本申請實施例提供一種計算機可讀存儲介質，存儲有可執行指令，用于被處理器執行時，實現本申請實施例提供的音頻編解碼方法。

25、本申請實施例提供一種計算機程序產品，包括計算機程序或指令，用于被處理器執行時，實現本申請實施例提供的音頻編解碼方法。

26、本申請實施例具有以下有益效果：

27、通過對解碼得到的特征向量的預測值進行標簽提取處理，得到用于信號增強的標簽信息向量，并結合特征向量的預測值和標簽信息向量進行信號重建，如此，相較于僅僅基于特征向量的預測值進行信號重建，結合特征向量的預測值和標簽信息向量進行信號重建，相當于增加了音頻信號中核心成分所占的比例，減小了噪聲等聲學干擾所占的比例，從而可以有效抑制編碼端采集的音頻信號中包括的噪聲成分，進而提高了重建得到的音頻信號的質量。

本文檔來自技高網...

【技術保護點】

1.一種音頻解碼方法，其特征在于，所述方法包括：

2.根據權利要求1所述的方法，其特征在于，

3.根據權利要求1所述的方法，其特征在于，所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建，包括：

4.根據權利要求3所述的方法，其特征在于，所述對所述特征向量的預測值和所述標簽信息向量進行融合處理，得到融合向量，包括：

5.根據權利要求3所述的方法，其特征在于，

6.根據權利要求1所述的方法，其特征在于，所述對所述碼流進行解碼處理，得到所述音頻信號的特征向量的預測值，包括：

7.根據權利要求1所述的方法，其特征在于，

8.根據權利要求7所述的方法，其特征在于，

9.根據權利要求8所述的方法，其特征在于，

10.根據權利要求7至10任一項所述的方法，其特征在于，所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建，包括：

11.根據權利要求10所述的方法，其特征在于，所述對所述N個子帶信號分別對應的特征向量的預測值、以及所述N個標簽信息向量進行一一對應的

12.根據權利要求10所述的方法，其特征在于，所述基于第j融合向量調用第j合成網絡進行信號重建，得到第j子帶信號的預測值，包括：

13.根據權利要求12所述的方法，其特征在于，

14.一種音頻編碼方法，其特征在于，所述方法包括：

15.一種處理碼流的方法，其特征在于，所述碼流基于權利要求1至13任一項所述的音頻解碼方法進行解碼，或者根據權利要求14所述的音頻編碼方法產生。

16.一種處理碼流的方法，其特征在于，在計算機可讀存儲介質上存儲所述碼流，所述碼流基于權利要求1至13任一項所述的音頻解碼方法進行解碼，或者根據權利要求14所述的音頻編碼方法產生。

17.一種音頻解碼裝置，其特征在于，所述裝置包括：

18.一種音頻編碼裝置，其特征在于，所述裝置包括：

19.一種計算機可讀存儲介質，存儲有可執行指令，其特征在于，所述可執行指令被處理器執行時實現權利要求1至13任一項所述的音頻解碼方法或權利要求14所述的音頻編碼方法。

20.一種計算機程序產品，包括計算機程序或指令，其特征在于，所述計算機程序或指令被處理器執行時實現權利要求1至13任一項所述的音頻解碼方法或權利要求14所述的音頻編碼方法。

...

【技術特征摘要】

1.一種音頻解碼方法，其特征在于，所述方法包括：

2.根據權利要求1所述的方法，其特征在于，

3.根據權利要求1所述的方法，其特征在于，所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建，包括：

4.根據權利要求3所述的方法，其特征在于，所述對所述特征向量的預測值和所述標簽信息向量進行融合處理，得到融合向量，包括：

5.根據權利要求3所述的方法，其特征在于，

6.根據權利要求1所述的方法，其特征在于，所述對所述碼流進行解碼處理，得到所述音頻信號的特征向量的預測值，包括：

7.根據權利要求1所述的方法，其特征在于，

8.根據權利要求7所述的方法，其特征在于，

9.根據權利要求8所述的方法，其特征在于，

10.根據權利要求7至10任一項所述的方法，其特征在于，所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建，包括：

11.根據權利要求10所述的方法，其特征在于，所述對所述n個子帶信號分別對應的特征向量的預測值、以及所述n個標簽信息向量進行一一對應的融合處理，得到n個融合向量，包括：

12.根據權利要求10所述的...

【專利技術屬性】
技術研發人員：史裕鵬，肖瑋，王蒙，康迂勇，黃慶博，
申請(專利權)人：騰訊科技深圳有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術