System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及通信,尤其涉及一種音頻解碼、編碼方法、裝置、電子設備及存儲介質。
技術介紹
1、由于語音通信的便利性和及時性,語音通話的應用越來越廣泛,例如在網絡會議的會議參與方之間傳輸音頻信號(例如語音信號)。而在語音通話中,語音信號可能會被混有噪聲等聲學干擾,語音信號中所混有的噪聲會導致通話質量變差,從而極大地影響了用戶的聽覺體驗。
2、然而,對于如何對語音信號進行增強處理以抑制噪聲部分,相關技術尚無有效的解決方案。
技術實現思路
1、本申請實施例提供一種音頻解碼、編碼方法、裝置、電子設備、計算機可讀存儲介質及計算機程序產品,能夠有效抑制音頻信號中的聲學干擾,進而提高重建得到的音頻信號的質量。
2、本申請實施例的技術方案是這樣實現的:
3、本申請實施例提供一種音頻解碼方法,包括:
4、獲取碼流,其中,所述碼流是對音頻信號進行編碼得到的;
5、對所述碼流進行解碼處理,得到所述音頻信號的特征向量的預測值;
6、對所述特征向量的預測值進行標簽提取處理,得到用于信號增強的標簽信息向量,其中,所述標簽信息向量的維度與所述特征向量的預測值的維度相同;
7、基于所述特征向量的預測值和所述標簽信息向量進行信號重建;
8、將通過所述信號重建得到的所述音頻信號的預測值,作為所述碼流的解碼結果。
9、本申請實施例提供一種音頻解碼裝置,包括:
10、獲取模塊,用于獲取碼流,其中,所述碼流是
11、解碼模塊,用于對所述碼流進行解碼處理,得到所述音頻信號的特征向量的預測值;
12、標簽提取模塊,用于對所述特征向量的預測值進行標簽提取處理,得到用于信號增強的標簽信息向量,其中,所述標簽信息向量的維度與所述特征向量的預測值的維度相同;
13、重建模塊,用于基于所述特征向量的預測值和所述標簽信息向量進行信號重建;
14、確定模塊,用于將通過所述信號重建得到的所述音頻信號的預測值,作為所述碼流的解碼結果。
15、本申請實施例提供一種音頻編碼方法,包括:
16、獲取音頻信號;
17、對所述音頻信號進行編碼處理,得到碼流,其中,所述碼流用于供電子設備執行本申請實施例提供的音頻解碼方法。
18、本申請實施例提供一種音頻編碼裝置,包括:
19、獲取模塊,用于獲取音頻信號;
20、編碼模塊,用于對所述音頻信號進行編碼處理,得到碼流,其中,所述碼流用于供電子設備執行本申請實施例提供的音頻解碼方法。
21、本申請實施例提供一種電子設備,包括:
22、存儲器,用于存儲可執行指令;
23、處理器,用于執行所述存儲器中存儲的可執行指令時,實現本申請實施例提供的音頻編解碼方法。
24、本申請實施例提供一種計算機可讀存儲介質,存儲有可執行指令,用于被處理器執行時,實現本申請實施例提供的音頻編解碼方法。
25、本申請實施例提供一種計算機程序產品,包括計算機程序或指令,用于被處理器執行時,實現本申請實施例提供的音頻編解碼方法。
26、本申請實施例具有以下有益效果:
27、通過對解碼得到的特征向量的預測值進行標簽提取處理,得到用于信號增強的標簽信息向量,并結合特征向量的預測值和標簽信息向量進行信號重建,如此,相較于僅僅基于特征向量的預測值進行信號重建,結合特征向量的預測值和標簽信息向量進行信號重建,相當于增加了音頻信號中核心成分所占的比例,減小了噪聲等聲學干擾所占的比例,從而可以有效抑制編碼端采集的音頻信號中包括的噪聲成分,進而提高了重建得到的音頻信號的質量。
本文檔來自技高網...【技術保護點】
1.一種音頻解碼方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,
3.根據權利要求1所述的方法,其特征在于,所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建,包括:
4.根據權利要求3所述的方法,其特征在于,所述對所述特征向量的預測值和所述標簽信息向量進行融合處理,得到融合向量,包括:
5.根據權利要求3所述的方法,其特征在于,
6.根據權利要求1所述的方法,其特征在于,所述對所述碼流進行解碼處理,得到所述音頻信號的特征向量的預測值,包括:
7.根據權利要求1所述的方法,其特征在于,
8.根據權利要求7所述的方法,其特征在于,
9.根據權利要求8所述的方法,其特征在于,
10.根據權利要求7至10任一項所述的方法,其特征在于,所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建,包括:
11.根據權利要求10所述的方法,其特征在于,所述對所述N個子帶信號分別對應的特征向量的預測值、以及所述N個標簽信息向量進行一一對應的
12.根據權利要求10所述的方法,其特征在于,所述基于第j融合向量調用第j合成網絡進行信號重建,得到第j子帶信號的預測值,包括:
13.根據權利要求12所述的方法,其特征在于,
14.一種音頻編碼方法,其特征在于,所述方法包括:
15.一種處理碼流的方法,其特征在于,所述碼流基于權利要求1至13任一項所述的音頻解碼方法進行解碼,或者根據權利要求14所述的音頻編碼方法產生。
16.一種處理碼流的方法,其特征在于,在計算機可讀存儲介質上存儲所述碼流,所述碼流基于權利要求1至13任一項所述的音頻解碼方法進行解碼,或者根據權利要求14所述的音頻編碼方法產生。
17.一種音頻解碼裝置,其特征在于,所述裝置包括:
18.一種音頻編碼裝置,其特征在于,所述裝置包括:
19.一種計算機可讀存儲介質,存儲有可執行指令,其特征在于,所述可執行指令被處理器執行時實現權利要求1至13任一項所述的音頻解碼方法或權利要求14所述的音頻編碼方法。
20.一種計算機程序產品,包括計算機程序或指令,其特征在于,所述計算機程序或指令被處理器執行時實現權利要求1至13任一項所述的音頻解碼方法或權利要求14所述的音頻編碼方法。
...【技術特征摘要】
1.一種音頻解碼方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,
3.根據權利要求1所述的方法,其特征在于,所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建,包括:
4.根據權利要求3所述的方法,其特征在于,所述對所述特征向量的預測值和所述標簽信息向量進行融合處理,得到融合向量,包括:
5.根據權利要求3所述的方法,其特征在于,
6.根據權利要求1所述的方法,其特征在于,所述對所述碼流進行解碼處理,得到所述音頻信號的特征向量的預測值,包括:
7.根據權利要求1所述的方法,其特征在于,
8.根據權利要求7所述的方法,其特征在于,
9.根據權利要求8所述的方法,其特征在于,
10.根據權利要求7至10任一項所述的方法,其特征在于,所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建,包括:
11.根據權利要求10所述的方法,其特征在于,所述對所述n個子帶信號分別對應的特征向量的預測值、以及所述n個標簽信息向量進行一一對應的融合處理,得到n個融合向量,包括:
12.根據權利要求10所述的...
【專利技術屬性】
技術研發人員:史裕鵬,肖瑋,王蒙,康迂勇,黃慶博,
申請(專利權)人:騰訊科技深圳有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。