當(dāng)前位置: 首頁 > 專利查詢>弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)專利>正文

參數(shù)編碼與解碼制造技術(shù)

技術(shù)編號(hào)：44500924 閱讀：4 留言：0更新日期：2025-03-04 18:09

公開了編碼和解碼技術(shù)的幾個(gè)示例。特別地，一種音頻合成器(300)，用于從降混信號(hào)(246，x)產(chǎn)生合成信號(hào)(336，340，y<subgt;R</subgt;)，包括：輸入接口(312)，用于接收降混信號(hào)(246，x)，降混信號(hào)(246，x)具有多個(gè)降混聲道和側(cè)信息(228)，側(cè)信息(228)包括原始信號(hào)(212，y)的聲道電平和相關(guān)信息(314，ξ，χ)，原始信號(hào)(212，y)具有多個(gè)原始聲道；以及合成處理器(404)，用于根據(jù)至少一個(gè)混合規(guī)則，使用以下來產(chǎn)生合成信號(hào)(336，340，y<subgt;R</subgt;)：原始信號(hào)(212，y)的聲道電平和相關(guān)信息(220，314，ξ，χ)；以及與降混信號(hào)(324，246，x)相關(guān)聯(lián)的協(xié)方差信息(C<subgt;x</subgt;)。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】

1.簡(jiǎn)介在此，公開了編碼和解碼技術(shù)的幾個(gè)示例。特別地，一種專利技術(shù)針對(duì)在低位速率編碼和解碼多聲道音頻內(nèi)容，例如使用dirac框架。這種方法可以在使用低位速率的同時(shí)獲得高質(zhì)量的輸出。這可以被用于許多應(yīng)用，包括藝術(shù)作品、通信和虛擬現(xiàn)實(shí)。

技術(shù)介紹

1、1.1現(xiàn)有技術(shù)

2、本節(jié)簡(jiǎn)要地描述現(xiàn)有技術(shù)。

3、1.1.1多聲道內(nèi)容的離散編碼

4、編碼和傳輸多聲道內(nèi)容的最直接方法是直接量化和編碼多聲道音頻信號(hào)的波形，而無需任何事先處理或者假設(shè)。盡管所述方法在理論上可以完美地工作，但存在一個(gè)主要缺點(diǎn)，即編碼所述多聲道內(nèi)容所需的位消耗。因此，將被描述的其他方法(以及所提出的專利技術(shù))是所謂的“參數(shù)方法”，因?yàn)樗鼈兪褂迷獏?shù)(meta-parameters)以描述和發(fā)送所述多聲道音頻信號(hào)而不是原始音頻多聲道信號(hào)本身。

5、1.1.2mpeg環(huán)繞

6、mpeg環(huán)繞是在2006年被完成的iso/mpeg標(biāo)準(zhǔn)，用于多聲道聲音的參數(shù)編碼[1]。此方法主要依賴于兩個(gè)參數(shù)集：

7、-聲道間相干(interchannel?coherences，icc)，它描述在給定多聲道音頻信號(hào)的每個(gè)聲道之間的相干。

8、-聲道電平差(channel?level?difference，cld)，對(duì)應(yīng)于多聲道音頻信號(hào)的兩個(gè)輸入聲道之間的電平差。

9、mpeg環(huán)繞的一種特殊性是使用所謂的“樹結(jié)構(gòu)”，這些結(jié)構(gòu)允許“通過單個(gè)輸出聲道描述兩個(gè)輸入聲道”(引用自[1])。

10、作為示

11、mpeg環(huán)繞的主要優(yōu)點(diǎn)取決于此結(jié)構(gòu)和在前面被提到的參數(shù)的使用。然而，mpeg環(huán)繞的缺點(diǎn)之一是由于所述樹結(jié)構(gòu)缺乏靈活性。同樣由于處理的特殊性，在某些特定項(xiàng)目上可能會(huì)發(fā)生質(zhì)量惡化。

12、除了其他之外，參見圖7，示出從[1]抽取的用于5.1信號(hào)的mpeg環(huán)繞編碼器的概覽。

13、1.2定向音頻編碼

14、定向音頻編碼(directional?audio?coding，縮寫為“dirac”)[2]也是一種再現(xiàn)空間音頻的參數(shù)方法，它是由在芬蘭的阿爾托(aalto)大學(xué)的維爾·普爾基(ville?pulkki)開發(fā)的。dirac依靠頻帶處理，所述頻帶處理使用兩個(gè)參數(shù)集來描述空間聲音：

15、-到達(dá)方向(doa)，這是一個(gè)角度，以度為單位，描述在音頻信號(hào)中占主導(dǎo)地位的聲音(predominant?sound)的到達(dá)方向。

16、-擴(kuò)散度，這是介于0與1之間的值，用于描述所述聲音有多“擴(kuò)散”。如果所述值為0，則所述聲音是非擴(kuò)散的，并且可以被同化為來自精確角度的點(diǎn)狀源；如果所述值為1，則所述聲音是完全擴(kuò)散的，并且被假設(shè)為來自“每一個(gè)”角度。

17、為了合成所述輸出信號(hào)，dirac假設(shè)其被分解為擴(kuò)散和非擴(kuò)散部分，所述擴(kuò)散聲音合成旨在產(chǎn)生對(duì)一周圍聲音的感知，而直接聲音合成則旨在產(chǎn)生占主導(dǎo)地位的聲音。

18、鑒于dirac提供高質(zhì)量的輸出，但它有一個(gè)主要缺點(diǎn)：它不適用于多聲道音頻信號(hào)。因此，所述doa和擴(kuò)散參數(shù)不太適合描述多聲道音頻輸入，因此，輸出質(zhì)量受到影響。

19、1.3雙耳提示編碼

20、雙耳提示編碼(binaural?cue?coding，bcc)[3]是由克里斯托夫·法爾(christoffaller)開發(fā)的一種參數(shù)化方法。此方法依賴于類似的參數(shù)集如同那些被描述用于mpeg環(huán)繞(請(qǐng)參見1.1.2)，即：

21、-聲道間電平差(icld)，其是在多聲道輸入信號(hào)的兩個(gè)聲道之間的能量比的測(cè)量。

22、-聲道間時(shí)間差(ictd)，其是在多聲道輸入信號(hào)的兩個(gè)聲道之間的延遲的測(cè)量。

23、-聲道間相關(guān)度(icc)，其是在多聲道輸入信號(hào)的兩個(gè)聲道之間的關(guān)聯(lián)的測(cè)量。

24、與稍后將被描述的新穎專利技術(shù)相比，所述bcc方法就發(fā)送的參數(shù)的計(jì)算而言具有非常相似的特性，但是它缺乏被發(fā)送的參數(shù)的靈活性和可以縮放性。

25、1.4mpeg空間音頻對(duì)象編碼

26、空間音頻對(duì)象編碼(spatial?audio?object?coding)[4]將在此被簡(jiǎn)單提及。這是用于對(duì)所謂的音頻對(duì)象進(jìn)行編碼的mpeg標(biāo)準(zhǔn)，這在一定程度上與多聲道信號(hào)有關(guān)。它使用與mpeg環(huán)繞類似的參數(shù)。

技術(shù)實(shí)現(xiàn)思路

1、1.5現(xiàn)有技術(shù)的誘因/缺點(diǎn)

2、1.5.1誘因

3、1.5.1.1使用dirac框架

4、本專利技術(shù)必須被提到的一個(gè)方面是當(dāng)前專利技術(shù)必須適合于所述dirac框架。盡管如此，之前也提到過dirac的參數(shù)不適用于多聲道音頻信號(hào)。有關(guān)此主題應(yīng)給予更多解釋。

5、所述原始的dirac處理使用麥克風(fēng)信號(hào)或者歧義信號(hào)(ambisonics?signals)。從這些信號(hào)，計(jì)算參數(shù)，即到達(dá)方向(doa)和擴(kuò)散度。

6、為了將dirac與多聲道音頻信號(hào)一起使用，被嘗試的第一種方法是使用一種由維爾·普爾基(ville?pulkki)提出的方法，將所述多聲道信號(hào)轉(zhuǎn)換為歧義內(nèi)容，如在[5]所述。然后，一旦這些歧義信號(hào)從所述多聲道音頻信號(hào)中被導(dǎo)出，就可以使用doa和擴(kuò)散進(jìn)行常規(guī)的dirac處理。首次嘗試的結(jié)果是被輸出的多聲道信號(hào)的質(zhì)量和空間特征惡化，并且無法滿足目的應(yīng)用程序的要求。

7、因此，本新穎專利技術(shù)背后的主動(dòng)機(jī)是使用參數(shù)集，所述參數(shù)集有效地描述所述多聲道信號(hào)，并且還使用所述dirac框架，進(jìn)一步的解釋將在1.1.2節(jié)中給出。

8、1.5.1.2提供在低位速率操作的系統(tǒng)

9、本專利技術(shù)的目的和目標(biāo)之一是提出一種允許低位速率應(yīng)用的方法。這需要找到最佳數(shù)據(jù)集以描述在編碼器與解碼器之間的多聲道內(nèi)容。這還需要就傳輸參數(shù)的數(shù)量和輸出質(zhì)量而言找到最佳的權(quán)衡。

10、1.5.1.3提供靈活的系統(tǒng)

11、本專利技術(shù)的另一個(gè)重要目的是提出一種靈活的系統(tǒng)，所述系統(tǒng)可以接受旨在任何揚(yáng)聲器設(shè)置上被再現(xiàn)的任何多聲道音頻格式。取決于輸入設(shè)置，輸出質(zhì)量不應(yīng)受到損害。

12、1.5.2現(xiàn)有技術(shù)的缺點(diǎn)

13、在前面提到的現(xiàn)有技術(shù)的幾個(gè)缺點(diǎn)在下表中被列出。

14、

15、2.專利技術(shù)描述

16、2.1專利技術(shù)概述

17、根據(jù)一個(gè)方面，提本文檔來自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】

1.一種音頻編碼器(200)，用于從原始信號(hào)(212，y)產(chǎn)生降混信號(hào)(246，x)，所述原始信號(hào)(212，y)具有多個(gè)原始聲道，所述降混信號(hào)(246，x)具有多個(gè)降混聲道，所述音頻編碼器(200)包括：

2.根據(jù)權(quán)利要求1所述的音頻編碼器，被配置為作為標(biāo)準(zhǔn)化值來提供所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)。

3.根據(jù)權(quán)利要求1所述的音頻編碼器，其中被編碼在所述側(cè)信息(228)中的所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)至少包括或者表示與所述原始聲道的總數(shù)量相關(guān)聯(lián)的聲道電平信息。

4.根據(jù)權(quán)利要求1所述的音頻編碼器，其中被編碼在所述側(cè)信息(228)中的所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)至少包括或者表示相關(guān)信息(220，908)，所述相關(guān)信息(220，908)描述在至少一對(duì)、但少于所述原始聲道的總數(shù)量的不同原始聲道之間的能量關(guān)系。

5.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)包括至少一個(gè)相干值(ξi,j)，所述相干

6.根據(jù)權(quán)利要求5所述的音頻編碼器，其中相干值被標(biāo)準(zhǔn)化。

7.根據(jù)權(quán)利要求5所述的音頻編碼器，其中相干值是

8.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)包括至少一個(gè)聲道間電平差I(lǐng)CLD。

9.根據(jù)權(quán)利要求8所述的音頻編碼器，其中所述至少一個(gè)ICLD是作為對(duì)數(shù)值提供的。

10.根據(jù)權(quán)利要求8所述的音頻編碼器，其中所述至少一個(gè)ICLD被標(biāo)準(zhǔn)化。

11.根據(jù)權(quán)利要求10所述的音頻編碼器，其中所述ICLD是

12.根據(jù)權(quán)利要求1所述的音頻編碼器，被配置為在狀態(tài)信息(252)的基礎(chǔ)上選擇(250)是否對(duì)所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)的至少一部分進(jìn)行編碼或者不對(duì)其進(jìn)行編碼，以便在有效載荷相對(duì)較低的情況下，在所述側(cè)信息(228)中包括增加數(shù)量的聲道電平和相關(guān)信息(220)。

13.根據(jù)權(quán)利要求1所述的音頻編碼器，被配置為在關(guān)于聲道的量度(252)的基礎(chǔ)上選擇(250)要將所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)的哪一部分編碼在所述側(cè)信息(228)中，以便在所述側(cè)信息(228)中包括與更敏感的量度相關(guān)聯(lián)的聲道電平和相關(guān)信息(220)。

14.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)是矩陣(Cy)的項(xiàng)的形式。

15.根據(jù)權(quán)利要求14所述的音頻編碼器，其中所述矩陣是對(duì)稱矩陣或者厄米特矩陣，其中所述聲道電平和相關(guān)信息(220)的所述項(xiàng)是針對(duì)所述矩陣(Cy)的對(duì)角線中的全部項(xiàng)或者少于總數(shù)量的項(xiàng)和/或針對(duì)少于所述矩陣(Cy)的非對(duì)角元素的一半提供的。

16.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述位流寫入器(226)被配置為對(duì)至少一個(gè)聲道的標(biāo)識(shí)進(jìn)行編碼。

17.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述原始信號(hào)(212，y)或者其經(jīng)處理的版本(216)被劃分為多個(gè)具有相等時(shí)間長(zhǎng)度的后續(xù)幀。

18.根據(jù)權(quán)利要求17所述的音頻編碼器，被配置為將針對(duì)每個(gè)幀特定的所述原始信號(hào)(212，y)的聲道電平和相關(guān)信息(220)編碼在所述側(cè)信息(228)中。

19.根據(jù)權(quán)利要求18所述的音頻編碼器，被配置為將共同地與多個(gè)連續(xù)幀相關(guān)聯(lián)的所述原始信號(hào)(212，y)的相同聲道電平和相關(guān)信息(220)編碼在所述側(cè)信息(228)中。

20.根據(jù)權(quán)利要求18所述的音頻編碼器，被配置為選擇為其選擇了所述原始信號(hào)(212，y)的相同聲道電平和相關(guān)信息(220)的連續(xù)幀的數(shù)量，以使得：

21.根據(jù)權(quán)利要求19所述的音頻編碼器，被配置為在檢測(cè)到瞬態(tài)時(shí)減少所述原始信號(hào)(212，y)的相同聲道電平和相關(guān)信息(220)所關(guān)聯(lián)的所述連續(xù)幀的數(shù)量。

22.根據(jù)權(quán)利要求17所述的音頻編碼器，其中每個(gè)幀被細(xì)分為整數(shù)數(shù)量的連續(xù)時(shí)隙。

23.根據(jù)權(quán)利要求22所述的音頻編碼器，被配置為針對(duì)每個(gè)時(shí)隙估計(jì)所述聲道電平和相關(guān)信息(220)，并且將針對(duì)不同時(shí)隙估計(jì)的所述聲道電平和相關(guān)信息(220)的總和或者平均值或者另一預(yù)定線性組合編碼在所述側(cè)信息(228)中。

24.根據(jù)權(quán)利要求23所述的音頻編碼器，被配置為對(duì)所述幀的時(shí)域版本執(zhí)行瞬態(tài)分析(258)，以確定在所述幀內(nèi)的瞬態(tài)的發(fā)生。

25...

【技術(shù)特征摘要】

2.根據(jù)權(quán)利要求1所述的音頻編碼器，被配置為作為標(biāo)準(zhǔn)化值來提供所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)。

5.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)包括至少一個(gè)相干值(ξi,j)，所述相干值(ξi,j)描述在一對(duì)原始聲道中的兩個(gè)聲道之間的相干。

6.根據(jù)權(quán)利要求5所述的音頻編碼器，其中相干值被標(biāo)準(zhǔn)化。

7.根據(jù)權(quán)利要求5所述的音頻編碼器，其中相干值是

8.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)包括至少一個(gè)聲道間電平差icld。

9.根據(jù)權(quán)利要求8所述的音頻編碼器，其中所述至少一個(gè)icld是作為對(duì)數(shù)值提供的。

10.根據(jù)權(quán)利要求8所述的音頻編碼器，其中所述至少一個(gè)icld被標(biāo)準(zhǔn)化。

11.根據(jù)權(quán)利要求10所述的音頻編碼器，其中所述icld是

14.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述原始信號(hào)(212，y)的所述聲道電平和相關(guān)信息(220)是矩陣(cy)的項(xiàng)的形式。

15.根據(jù)權(quán)利要求14所述的音頻編碼器，其中所述矩陣是對(duì)稱矩陣或者厄米特矩陣，其中所述聲道電平和相關(guān)信息(220)的所述項(xiàng)是針對(duì)所述矩陣(cy)的對(duì)角線中的全部項(xiàng)或者少于總數(shù)量的項(xiàng)和/或針對(duì)少于所述矩陣(cy)的非對(duì)角元素的一半提供的。

16.根據(jù)權(quán)利要求1所述的音頻編碼器，其中所述位流寫入器(226)被配置為對(duì)至少一個(gè)聲道的標(biāo)識(shí)進(jìn)行編碼。

22.根據(jù)權(quán)利要求17所述的音頻編碼器，其中每個(gè)幀被細(xì)分為整數(shù)數(shù)量的連續(xù)時(shí)隙。

25.根據(jù)權(quán)利要求24所述的音頻解碼器，被配置為確定所述瞬態(tài)...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：亞歷山德拉·博塞翁，吉約姆·福克斯，馬爾庫斯·穆特魯斯，法比安·庫赤，奧利弗·蒂爾加特，斯特凡·拜耳，薩沙·迪施，于爾根·赫勒，
申請(qǐng)(專利權(quán))人：弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)，
類型：發(fā)明
國(guó)別省市：

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評(píng)論

還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)