System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
1.簡(jiǎn)介在此,公開了編碼和解碼技術(shù)的幾個(gè)示例。特別地,一種專利技術(shù)針對(duì)在低位速率編碼和解碼多聲道音頻內(nèi)容,例如使用dirac框架。這種方法可以在使用低位速率的同時(shí)獲得高質(zhì)量的輸出。這可以被用于許多應(yīng)用,包括藝術(shù)作品、通信和虛擬現(xiàn)實(shí)。
技術(shù)介紹
1、1.1現(xiàn)有技術(shù)
2、本節(jié)簡(jiǎn)要地描述現(xiàn)有技術(shù)。
3、1.1.1多聲道內(nèi)容的離散編碼
4、編碼和傳輸多聲道內(nèi)容的最直接方法是直接量化和編碼多聲道音頻信號(hào)的波形,而無需任何事先處理或者假設(shè)。盡管所述方法在理論上可以完美地工作,但存在一個(gè)主要缺點(diǎn),即編碼所述多聲道內(nèi)容所需的位消耗。因此,將被描述的其他方法(以及所提出的專利技術(shù))是所謂的“參數(shù)方法”,因?yàn)樗鼈兪褂迷獏?shù)(meta-parameters)以描述和發(fā)送所述多聲道音頻信號(hào)而不是原始音頻多聲道信號(hào)本身。
5、1.1.2mpeg環(huán)繞
6、mpeg環(huán)繞是在2006年被完成的iso/mpeg標(biāo)準(zhǔn),用于多聲道聲音的參數(shù)編碼[1]。此方法主要依賴于兩個(gè)參數(shù)集:
7、-聲道間相干(interchannel?coherences,icc),它描述在給定多聲道音頻信號(hào)的每個(gè)聲道之間的相干。
8、-聲道電平差(channel?level?difference,cld),對(duì)應(yīng)于多聲道音頻信號(hào)的兩個(gè)輸入聲道之間的電平差。
9、mpeg環(huán)繞的一種特殊性是使用所謂的“樹結(jié)構(gòu)”,這些結(jié)構(gòu)允許“通過單個(gè)輸出聲道描述兩個(gè)輸入聲道”(引用自[1])。
10、作為示
11、mpeg環(huán)繞的主要優(yōu)點(diǎn)取決于此結(jié)構(gòu)和在前面被提到的參數(shù)的使用。然而,mpeg環(huán)繞的缺點(diǎn)之一是由于所述樹結(jié)構(gòu)缺乏靈活性。同樣由于處理的特殊性,在某些特定項(xiàng)目上可能會(huì)發(fā)生質(zhì)量惡化。
12、除了其他之外,參見圖7,示出從[1]抽取的用于5.1信號(hào)的mpeg環(huán)繞編碼器的概覽。
13、1.2定向音頻編碼
14、定向音頻編碼(directional?audio?coding,縮寫為“dirac”)[2]也是一種再現(xiàn)空間音頻的參數(shù)方法,它是由在芬蘭的阿爾托(aalto)大學(xué)的維爾·普爾基(ville?pulkki)開發(fā)的。dirac依靠頻帶處理,所述頻帶處理使用兩個(gè)參數(shù)集來描述空間聲音:
15、-到達(dá)方向(doa),這是一個(gè)角度,以度為單位,描述在音頻信號(hào)中占主導(dǎo)地位的聲音(predominant?sound)的到達(dá)方向。
16、-擴(kuò)散度,這是介于0與1之間的值,用于描述所述聲音有多“擴(kuò)散”。如果所述值為0,則所述聲音是非擴(kuò)散的,并且可以被同化為來自精確角度的點(diǎn)狀源;如果所述值為1,則所述聲音是完全擴(kuò)散的,并且被假設(shè)為來自“每一個(gè)”角度。
17、為了合成所述輸出信號(hào),dirac假設(shè)其被分解為擴(kuò)散和非擴(kuò)散部分,所述擴(kuò)散聲音合成旨在產(chǎn)生對(duì)一周圍聲音的感知,而直接聲音合成則旨在產(chǎn)生占主導(dǎo)地位的聲音。
18、鑒于dirac提供高質(zhì)量的輸出,但它有一個(gè)主要缺點(diǎn):它不適用于多聲道音頻信號(hào)。因此,所述doa和擴(kuò)散參數(shù)不太適合描述多聲道音頻輸入,因此,輸出質(zhì)量受到影響。
19、1.3雙耳提示編碼
20、雙耳提示編碼(binaural?cue?coding,bcc)[3]是由克里斯托夫·法爾(christoffaller)開發(fā)的一種參數(shù)化方法。此方法依賴于類似的參數(shù)集如同那些被描述用于mpeg環(huán)繞(請(qǐng)參見1.1.2),即:
21、-聲道間電平差(icld),其是在多聲道輸入信號(hào)的兩個(gè)聲道之間的能量比的測(cè)量。
22、-聲道間時(shí)間差(ictd),其是在多聲道輸入信號(hào)的兩個(gè)聲道之間的延遲的測(cè)量。
23、-聲道間相關(guān)度(icc),其是在多聲道輸入信號(hào)的兩個(gè)聲道之間的關(guān)聯(lián)的測(cè)量。
24、與稍后將被描述的新穎專利技術(shù)相比,所述bcc方法就發(fā)送的參數(shù)的計(jì)算而言具有非常相似的特性,但是它缺乏被發(fā)送的參數(shù)的靈活性和可以縮放性。
25、1.4mpeg空間音頻對(duì)象編碼
26、空間音頻對(duì)象編碼(spatial?audio?object?coding)[4]將在此被簡(jiǎn)單提及。這是用于對(duì)所謂的音頻對(duì)象進(jìn)行編碼的mpeg標(biāo)準(zhǔn),這在一定程度上與多聲道信號(hào)有關(guān)。它使用與mpeg環(huán)繞類似的參數(shù)。
技術(shù)實(shí)現(xiàn)思路
1、1.5現(xiàn)有技術(shù)的誘因/缺點(diǎn)
2、1.5.1誘因
3、1.5.1.1使用dirac框架
4、本專利技術(shù)必須被提到的一個(gè)方面是當(dāng)前專利技術(shù)必須適合于所述dirac框架。盡管如此,之前也提到過dirac的參數(shù)不適用于多聲道音頻信號(hào)。有關(guān)此主題應(yīng)給予更多解釋。
5、所述原始的dirac處理使用麥克風(fēng)信號(hào)或者歧義信號(hào)(ambisonics?signals)。從這些信號(hào),計(jì)算參數(shù),即到達(dá)方向(doa)和擴(kuò)散度。
6、為了將dirac與多聲道音頻信號(hào)一起使用,被嘗試的第一種方法是使用一種由維爾·普爾基(ville?pulkki)提出的方法,將所述多聲道信號(hào)轉(zhuǎn)換為歧義內(nèi)容,如在[5]所述。然后,一旦這些歧義信號(hào)從所述多聲道音頻信號(hào)中被導(dǎo)出,就可以使用doa和擴(kuò)散進(jìn)行常規(guī)的dirac處理。首次嘗試的結(jié)果是被輸出的多聲道信號(hào)的質(zhì)量和空間特征惡化,并且無法滿足目的應(yīng)用程序的要求。
7、因此,本新穎專利技術(shù)背后的主動(dòng)機(jī)是使用參數(shù)集,所述參數(shù)集有效地描述所述多聲道信號(hào),并且還使用所述dirac框架,進(jìn)一步的解釋將在1.1.2節(jié)中給出。
8、1.5.1.2提供在低位速率操作的系統(tǒng)
9、本專利技術(shù)的目的和目標(biāo)之一是提出一種允許低位速率應(yīng)用的方法。這需要找到最佳數(shù)據(jù)集以描述在編碼器與解碼器之間的多聲道內(nèi)容。這還需要就傳輸參數(shù)的數(shù)量和輸出質(zhì)量而言找到最佳的權(quán)衡。
10、1.5.1.3提供靈活的系統(tǒng)
11、本專利技術(shù)的另一個(gè)重要目的是提出一種靈活的系統(tǒng),所述系統(tǒng)可以接受旨在任何揚(yáng)聲器設(shè)置上被再現(xiàn)的任何多聲道音頻格式。取決于輸入設(shè)置,輸出質(zhì)量不應(yīng)受到損害。
12、1.5.2現(xiàn)有技術(shù)的缺點(diǎn)
13、在前面提到的現(xiàn)有技術(shù)的幾個(gè)缺點(diǎn)在下表中被列出。
14、
15、2.專利技術(shù)描述
16、2.1專利技術(shù)概述
17、根據(jù)一個(gè)方面,提本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種音頻編碼器(200),用于從原始信號(hào)(212,y)產(chǎn)生降混信號(hào)(246,x),所述原始信號(hào)(212,y)具有多個(gè)原始聲道,所述降混信號(hào)(246,x)具有多個(gè)降混聲道,所述音頻編碼器(200)包括:
2.根據(jù)權(quán)利要求1所述的音頻編碼器,被配置為作為標(biāo)準(zhǔn)化值來提供所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)。
3.根據(jù)權(quán)利要求1所述的音頻編碼器,其中被編碼在所述側(cè)信息(228)中的所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)至少包括或者表示與所述原始聲道的總數(shù)量相關(guān)聯(lián)的聲道電平信息。
4.根據(jù)權(quán)利要求1所述的音頻編碼器,其中被編碼在所述側(cè)信息(228)中的所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)至少包括或者表示相關(guān)信息(220,908),所述相關(guān)信息(220,908)描述在至少一對(duì)、但少于所述原始聲道的總數(shù)量的不同原始聲道之間的能量關(guān)系。
5.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)包括至少一個(gè)相干值(ξi,j),所述相干
6.根據(jù)權(quán)利要求5所述的音頻編碼器,其中相干值被標(biāo)準(zhǔn)化。
7.根據(jù)權(quán)利要求5所述的音頻編碼器,其中相干值是
8.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)包括至少一個(gè)聲道間電平差I(lǐng)CLD。
9.根據(jù)權(quán)利要求8所述的音頻編碼器,其中所述至少一個(gè)ICLD是作為對(duì)數(shù)值提供的。
10.根據(jù)權(quán)利要求8所述的音頻編碼器,其中所述至少一個(gè)ICLD被標(biāo)準(zhǔn)化。
11.根據(jù)權(quán)利要求10所述的音頻編碼器,其中所述ICLD是
12.根據(jù)權(quán)利要求1所述的音頻編碼器,被配置為在狀態(tài)信息(252)的基礎(chǔ)上選擇(250)是否對(duì)所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)的至少一部分進(jìn)行編碼或者不對(duì)其進(jìn)行編碼,以便在有效載荷相對(duì)較低的情況下,在所述側(cè)信息(228)中包括增加數(shù)量的聲道電平和相關(guān)信息(220)。
13.根據(jù)權(quán)利要求1所述的音頻編碼器,被配置為在關(guān)于聲道的量度(252)的基礎(chǔ)上選擇(250)要將所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)的哪一部分編碼在所述側(cè)信息(228)中,以便在所述側(cè)信息(228)中包括與更敏感的量度相關(guān)聯(lián)的聲道電平和相關(guān)信息(220)。
14.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)是矩陣(Cy)的項(xiàng)的形式。
15.根據(jù)權(quán)利要求14所述的音頻編碼器,其中所述矩陣是對(duì)稱矩陣或者厄米特矩陣,其中所述聲道電平和相關(guān)信息(220)的所述項(xiàng)是針對(duì)所述矩陣(Cy)的對(duì)角線中的全部項(xiàng)或者少于總數(shù)量的項(xiàng)和/或針對(duì)少于所述矩陣(Cy)的非對(duì)角元素的一半提供的。
16.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述位流寫入器(226)被配置為對(duì)至少一個(gè)聲道的標(biāo)識(shí)進(jìn)行編碼。
17.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述原始信號(hào)(212,y)或者其經(jīng)處理的版本(216)被劃分為多個(gè)具有相等時(shí)間長(zhǎng)度的后續(xù)幀。
18.根據(jù)權(quán)利要求17所述的音頻編碼器,被配置為將針對(duì)每個(gè)幀特定的所述原始信號(hào)(212,y)的聲道電平和相關(guān)信息(220)編碼在所述側(cè)信息(228)中。
19.根據(jù)權(quán)利要求18所述的音頻編碼器,被配置為將共同地與多個(gè)連續(xù)幀相關(guān)聯(lián)的所述原始信號(hào)(212,y)的相同聲道電平和相關(guān)信息(220)編碼在所述側(cè)信息(228)中。
20.根據(jù)權(quán)利要求18所述的音頻編碼器,被配置為選擇為其選擇了所述原始信號(hào)(212,y)的相同聲道電平和相關(guān)信息(220)的連續(xù)幀的數(shù)量,以使得:
21.根據(jù)權(quán)利要求19所述的音頻編碼器,被配置為在檢測(cè)到瞬態(tài)時(shí)減少所述原始信號(hào)(212,y)的相同聲道電平和相關(guān)信息(220)所關(guān)聯(lián)的所述連續(xù)幀的數(shù)量。
22.根據(jù)權(quán)利要求17所述的音頻編碼器,其中每個(gè)幀被細(xì)分為整數(shù)數(shù)量的連續(xù)時(shí)隙。
23.根據(jù)權(quán)利要求22所述的音頻編碼器,被配置為針對(duì)每個(gè)時(shí)隙估計(jì)所述聲道電平和相關(guān)信息(220),并且將針對(duì)不同時(shí)隙估計(jì)的所述聲道電平和相關(guān)信息(220)的總和或者平均值或者另一預(yù)定線性組合編碼在所述側(cè)信息(228)中。
24.根據(jù)權(quán)利要求23所述的音頻編碼器,被配置為對(duì)所述幀的時(shí)域版本執(zhí)行瞬態(tài)分析(258),以確定在所述幀內(nèi)的瞬態(tài)的發(fā)生。
25...
【技術(shù)特征摘要】
1.一種音頻編碼器(200),用于從原始信號(hào)(212,y)產(chǎn)生降混信號(hào)(246,x),所述原始信號(hào)(212,y)具有多個(gè)原始聲道,所述降混信號(hào)(246,x)具有多個(gè)降混聲道,所述音頻編碼器(200)包括:
2.根據(jù)權(quán)利要求1所述的音頻編碼器,被配置為作為標(biāo)準(zhǔn)化值來提供所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)。
3.根據(jù)權(quán)利要求1所述的音頻編碼器,其中被編碼在所述側(cè)信息(228)中的所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)至少包括或者表示與所述原始聲道的總數(shù)量相關(guān)聯(lián)的聲道電平信息。
4.根據(jù)權(quán)利要求1所述的音頻編碼器,其中被編碼在所述側(cè)信息(228)中的所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)至少包括或者表示相關(guān)信息(220,908),所述相關(guān)信息(220,908)描述在至少一對(duì)、但少于所述原始聲道的總數(shù)量的不同原始聲道之間的能量關(guān)系。
5.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)包括至少一個(gè)相干值(ξi,j),所述相干值(ξi,j)描述在一對(duì)原始聲道中的兩個(gè)聲道之間的相干。
6.根據(jù)權(quán)利要求5所述的音頻編碼器,其中相干值被標(biāo)準(zhǔn)化。
7.根據(jù)權(quán)利要求5所述的音頻編碼器,其中相干值是
8.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)包括至少一個(gè)聲道間電平差icld。
9.根據(jù)權(quán)利要求8所述的音頻編碼器,其中所述至少一個(gè)icld是作為對(duì)數(shù)值提供的。
10.根據(jù)權(quán)利要求8所述的音頻編碼器,其中所述至少一個(gè)icld被標(biāo)準(zhǔn)化。
11.根據(jù)權(quán)利要求10所述的音頻編碼器,其中所述icld是
12.根據(jù)權(quán)利要求1所述的音頻編碼器,被配置為在狀態(tài)信息(252)的基礎(chǔ)上選擇(250)是否對(duì)所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)的至少一部分進(jìn)行編碼或者不對(duì)其進(jìn)行編碼,以便在有效載荷相對(duì)較低的情況下,在所述側(cè)信息(228)中包括增加數(shù)量的聲道電平和相關(guān)信息(220)。
13.根據(jù)權(quán)利要求1所述的音頻編碼器,被配置為在關(guān)于聲道的量度(252)的基礎(chǔ)上選擇(250)要將所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)的哪一部分編碼在所述側(cè)信息(228)中,以便在所述側(cè)信息(228)中包括與更敏感的量度相關(guān)聯(lián)的聲道電平和相關(guān)信息(220)。
14.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述原始信號(hào)(212,y)的所述聲道電平和相關(guān)信息(220)是矩陣(cy)的項(xiàng)的形式。
15.根據(jù)權(quán)利要求14所述的音頻編碼器,其中所述矩陣是對(duì)稱矩陣或者厄米特矩陣,其中所述聲道電平和相關(guān)信息(220)的所述項(xiàng)是針對(duì)所述矩陣(cy)的對(duì)角線中的全部項(xiàng)或者少于總數(shù)量的項(xiàng)和/或針對(duì)少于所述矩陣(cy)的非對(duì)角元素的一半提供的。
16.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述位流寫入器(226)被配置為對(duì)至少一個(gè)聲道的標(biāo)識(shí)進(jìn)行編碼。
17.根據(jù)權(quán)利要求1所述的音頻編碼器,其中所述原始信號(hào)(212,y)或者其經(jīng)處理的版本(216)被劃分為多個(gè)具有相等時(shí)間長(zhǎng)度的后續(xù)幀。
18.根據(jù)權(quán)利要求17所述的音頻編碼器,被配置為將針對(duì)每個(gè)幀特定的所述原始信號(hào)(212,y)的聲道電平和相關(guān)信息(220)編碼在所述側(cè)信息(228)中。
19.根據(jù)權(quán)利要求18所述的音頻編碼器,被配置為將共同地與多個(gè)連續(xù)幀相關(guān)聯(lián)的所述原始信號(hào)(212,y)的相同聲道電平和相關(guān)信息(220)編碼在所述側(cè)信息(228)中。
20.根據(jù)權(quán)利要求18所述的音頻編碼器,被配置為選擇為其選擇了所述原始信號(hào)(212,y)的相同聲道電平和相關(guān)信息(220)的連續(xù)幀的數(shù)量,以使得:
21.根據(jù)權(quán)利要求19所述的音頻編碼器,被配置為在檢測(cè)到瞬態(tài)時(shí)減少所述原始信號(hào)(212,y)的相同聲道電平和相關(guān)信息(220)所關(guān)聯(lián)的所述連續(xù)幀的數(shù)量。
22.根據(jù)權(quán)利要求17所述的音頻編碼器,其中每個(gè)幀被細(xì)分為整數(shù)數(shù)量的連續(xù)時(shí)隙。
23.根據(jù)權(quán)利要求22所述的音頻編碼器,被配置為針對(duì)每個(gè)時(shí)隙估計(jì)所述聲道電平和相關(guān)信息(220),并且將針對(duì)不同時(shí)隙估計(jì)的所述聲道電平和相關(guān)信息(220)的總和或者平均值或者另一預(yù)定線性組合編碼在所述側(cè)信息(228)中。
24.根據(jù)權(quán)利要求23所述的音頻編碼器,被配置為對(duì)所述幀的時(shí)域版本執(zhí)行瞬態(tài)分析(258),以確定在所述幀內(nèi)的瞬態(tài)的發(fā)生。
25.根據(jù)權(quán)利要求24所述的音頻解碼器,被配置為確定所述瞬態(tài)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:亞歷山德拉·博塞翁,吉約姆·福克斯,馬爾庫斯·穆特魯斯,法比安·庫赤,奧利弗·蒂爾加特,斯特凡·拜耳,薩沙·迪施,于爾根·赫勒,
申請(qǐng)(專利權(quán))人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì),
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。