• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    使用尺度參數的降采樣或內插對音頻信號進行編碼及解碼的裝置及方法制造方法及圖紙

    技術編號:24724484 閱讀:49 留言:0更新日期:2020-07-01 00:48
    一種用于對音頻信號進行編碼的裝置,包括:轉換器,用于將音頻信號轉換為譜表示;尺度參數計算器,用于依據音頻信號計算第一組尺度參數;降采樣器,用于對第一組尺度參數進行降采樣以獲得第二組尺度參數,其中第二組尺度參數中的尺度參數的第二數目低于第一組尺度參數中的尺度參數的第一數目;尺度參數編碼器,用于產生第二組尺度參數的編碼表示;譜處理器,用于使用第三組尺度參數處理音頻信號,第三組尺度參數具有大于尺度參數的第二數目的第三數目的尺度參數,其中譜處理器被配置為使用第一組尺度參數,或被配置為使用內插操作從第二組尺度參數或從第二組尺度參數的編碼表示得出第三組尺度參數;以及輸出接口,用于產生編碼輸出信號,編碼輸出信號包括關于譜表示的編碼表示的信息以及關于第二組尺度參數的編碼表示的信息。

    【技術實現步驟摘要】
    【國外來華專利技術】使用尺度參數的降采樣或內插對音頻信號進行編碼及解碼的裝置及方法
    本專利技術涉及音頻處理,且特別來講,涉及使用用于譜帶的尺度參數在譜域中操作的音頻處理。
    技術介紹
    現有技術1:高級音頻編碼(AAC)在最廣泛使用的目前先進技術的感知音頻編解碼器之一中,即在高級音頻編碼(AAC)[1-2]中,借助于所謂的尺度因子執行頻譜噪聲整形。在此方法中,MDCT譜被劃分成多個非均勻尺度因子頻帶。舉例而言,在48kHz處,MDCT具有1024個系數,且MDCT被劃分成49個尺度因子頻帶。在每一頻帶中,使用尺度因子來縮放所述頻帶的MDCT系數。隨后,采用具有恒定步長的標量量化器,對縮放后的MDCT系數進行量化。在解碼器側,在每一頻帶中執行逆縮放,對由標量量化器引入的量化噪聲進行整形。49個尺度因子作為側信息被編碼至位流中。由于相對較高的尺度因子數目及所需的高精度,因此通常需要相當大量的位用于對尺度因子進行編碼。這在低比特率及/或低延遲下可能成為問題。現有技術2:基于MDCT的TCX在基于MDCT的TCX(即,在MPEG-DUSAC[3]及3GPPEVS[4]標準中使用的基于變換的音頻編解碼器)中,借助于基于LPC的感知濾波器執行頻譜噪聲整形,所述感知濾波器與最近的基于ACELP的語音編解碼器(例如,AMR-WB)中所使用的感知濾波器相同。在此方法中,首先依據預加重的輸入信號,估計一組16個LPC。隨后,對LPC進行加權及量化。隨后,在64個均勻隔開的頻帶中,計算加權及量化后的LPC的頻率響應。隨后,使用所計算的頻率響應,在每一頻帶中對MDCT系數進行縮放。隨后,使用具有由全局增益控制的步長的標量量化器,對縮放后的MDCT系數進行量化。在解碼器處,在每64個頻帶中執行逆縮放,對由標量量化器引入的量化噪聲進行整形。與AAC方法相比,此方法具有明顯優勢:其僅需要對16個(LPC)+作為側信息的1個(全局增益)參數(與AAC中的49個參數相比)進行編碼。此外,可通過采用LSF表示及向量量化器,利用少量位有效地對16個LPC進行編碼。因此,與現有技術1的方法相比,現有技術2的方法需要更少的側信息位,這可在低比特率及/或低延遲下產生顯著差異。然而,此方法也具有一些缺陷。第一缺陷是噪聲整形的頻率縮放被限制為線性(即,使用均勻隔開的頻帶),這是因為LPC是在時域中估計的。這是不利的,因為人耳在低頻中比在高頻中更敏感。第二缺點是,此方法所需的高復雜性。LPC估計(自相關,萊文遜-德賓(Levinson-Durbin))、LPC量化(LPC<->LSF轉換、向量量化)及LPC頻率響應計算全部為高耗費的操作。第三缺陷是,此方法不是很靈活,這是因為基于LPC的感知濾波器不能被輕易修改,且這阻止了關鍵音頻項可能需要的一些特定調諧。現有技術3:改良的基于MDCT的TCX一些最近的工作已經解決了現有技術2的第一缺陷及部分第二缺陷。其公開于US9595262B2、EP2676266B1中。在此新方法中,自相關(用于估計LPC)不再在時域中執行,而改為使用MDCT系數能量的逆變換在MDCT域中計算。這允許通過簡單地將MDCT系數分組為64個非均勻頻帶且計算每一頻帶的能量,來使用非均勻頻率縮放。這也降低了計算自相關所需的復雜性。然而,即使使用所述新方法,所述第二缺陷及第三缺陷中的大多數仍然存在。
    技術實現思路
    本專利技術的目的是提供用于處理音頻信號的改良概念。所述目的通過如權利要求1所述的用于對音頻信號進行編碼的裝置、如權利要求24所述的用于對音頻信號進行編碼的方法、如權利要求25所述的對編碼音頻信號進行解碼的裝置、如權利要求40所述的對編碼音頻信號進行解碼的方法、或如權利要求41所述的計算機程序來實現。一種用于對音頻信號進行編碼的裝置包括用于將所述音頻信號轉換為譜表示的轉換器。此外,提供了用于依據所述譜表示計算第一組尺度參數的尺度參數計算器。另外,為了保持比特率盡可能低,對所述第一組尺度參數進行降采樣,以獲得第二組尺度參數,其中所述第二組尺度參數中的尺度參數的第二數目低于所述第一組尺度參數中的尺度參數的第一數目。此外,除了用于使用第三組尺度參數處理所述譜表示的譜處理器之外,還提供了用于產生所述第二組尺度參數的編碼表示的尺度參數編碼器,所述第三組尺度參數具有第三數目的尺度參數,所述第三數目大于尺度參數的所述第二數目。特別地,所述譜處理器被配置為使用所述第一組尺度參數,或使用內插操作從所述第二組尺度參數或從所述第二組尺度參數的所述編碼表示得出所述第三組尺度參數,以獲得所述音頻信號的編碼表示。此外,提供輸出接口以用于產生編碼輸出信號,所述編碼輸出信號包括關于所述音頻信號的所述編碼表示的信息,以及包括關于所述第二組尺度參數的所述編碼表示的信息。本專利技術是基于以下發現:可通過在編碼器側用較高數目的尺度因子進行縮放、且通過在編碼器側將尺度參數降采樣為第二組尺度參數或尺度因子來獲得無實質性質量損失的低比特率,其中第二組中隨后將被編碼且經由輸出接口傳輸或存儲的尺度參數少于尺度參數的所述第一數目。因此,在編碼器側一方面獲得精細縮放,且另一方面獲得低比特率。在解碼器側,通過尺度因子解碼器對所傳輸的小數目尺度因子進行解碼以獲得第一組尺度因子,其中所述第一組中的尺度因子或尺度參數的數目大于所述第二組中的尺度因子或尺度參數的數目,且由此,再次,在譜處理器內在解碼器側執行使用較高數目的尺度參數的精細縮放,以獲得精細縮放后的譜表示。因此,一方面獲得低比特率,而且盡管如此,另一方面還獲得音頻信號頻譜的高質量譜處理。如在優選實施例中進行的頻譜噪聲整形是僅使用非常低的比特率來實施的。因此,即使在低比特率的基于變換的音頻編解碼器中,所述頻譜噪聲整形也可為必需工具。頻譜噪聲整形在頻域中對量化噪聲進行整形,使得量化噪聲最小程度地被人耳感知,且因此,可最大化解碼輸出信號的感知質量。優選實施例依賴于從振幅相關量度(諸如譜表示的能量)計算的譜參數。特別地,逐頻帶能量、或者一般而言的逐頻帶的振幅相關量度被計算作為尺度參數的基礎,其中在計算逐頻帶的振幅相關量度中使用的帶寬是從較低頻帶向較高頻帶增大,以便盡可能地接近人類聽覺的特征。優選地,根據眾所周知的巴克(Bark)尺度將譜表示劃分為頻帶。在其他實施例中,計算線性域尺度參數,且特別地針對具有大數目的尺度參數的第一組尺度參數計算線性域尺度參數,且將所述大數目的尺度參數轉換至類對數域(log-likedomain)中。類對數域一般而言是其中小值被擴展而高值被壓縮的域。隨后,在類對數域中進行尺度參數的降采樣或抽取操作,所述類對數域可以是以10為底的對數域或以2為底的對數域,其中后者對于實施目的是優選的。隨后,在類對數域中計算第二組尺度因子,且優選地,執行第二組尺度因子的向量量化,其中尺度因子是在類對數域中。因此,向量量化的結果指示類對數域尺度參數。第二組尺度因子或尺度參數所具有的尺度因子的數目例如是第一組中本文檔來自技高網
    ...

    【技術保護點】
    1.一種用于對音頻信號(160)進行編碼的裝置,包括:/n轉換器(100),用于將所述音頻信號轉換為譜表示;/n尺度參數計算器(110),用于依據所述譜表示計算第一組尺度參數;/n降采樣器(130),用于對所述第一組尺度參數進行降采樣,以獲得第二組尺度參數,其中所述第二組尺度參數中的尺度參數的第二數目低于所述第一組尺度參數中的尺度參數的第一數目;/n尺度參數編碼器(140),用于產生所述第二組尺度參數的編碼表示;/n譜處理器(120),用于使用第三組尺度參數處理所述譜表示,所述第三組尺度參數具有第三數目的尺度參數,所述第三數目大于尺度參數的所述第二數目,其中所述譜處理器(120)被配置為使用所述第一組尺度參數,或被配置為使用內插操作從所述第二組尺度參數或從所述第二組尺度參數的所述編碼表示得出所述第三組尺度參數;以及/n輸出接口(150),用于產生編碼輸出信號(170),所述編碼輸出信號包括關于所述譜表示的所述編碼表示的信息、以及關于所述第二組尺度參數的所述編碼表示的信息。/n

    【技術特征摘要】
    【國外來華專利技術】20171110 EP PCT/EP2017/0789211.一種用于對音頻信號(160)進行編碼的裝置,包括:
    轉換器(100),用于將所述音頻信號轉換為譜表示;
    尺度參數計算器(110),用于依據所述譜表示計算第一組尺度參數;
    降采樣器(130),用于對所述第一組尺度參數進行降采樣,以獲得第二組尺度參數,其中所述第二組尺度參數中的尺度參數的第二數目低于所述第一組尺度參數中的尺度參數的第一數目;
    尺度參數編碼器(140),用于產生所述第二組尺度參數的編碼表示;
    譜處理器(120),用于使用第三組尺度參數處理所述譜表示,所述第三組尺度參數具有第三數目的尺度參數,所述第三數目大于尺度參數的所述第二數目,其中所述譜處理器(120)被配置為使用所述第一組尺度參數,或被配置為使用內插操作從所述第二組尺度參數或從所述第二組尺度參數的所述編碼表示得出所述第三組尺度參數;以及
    輸出接口(150),用于產生編碼輸出信號(170),所述編碼輸出信號包括關于所述譜表示的所述編碼表示的信息、以及關于所述第二組尺度參數的所述編碼表示的信息。


    2.如權利要求1所述的裝置,
    其中所述尺度參數計算器被配置為
    針對所述譜表示的多個頻帶中的每一頻帶,在線性域中計算振幅相關量度,以獲得第一組線性域量度;
    將所述第一組線性域量度變換至類對數域中,以獲得第一組類對數域量度;以及
    其中所述降采樣器(130)被配置為在所述類對數域中對所述第一組尺度因子進行降采樣,以在所述類對數域中獲得所述第二組尺度因子。


    3.如權利要求2所述的裝置,
    其中所述譜處理器(120)被配置為在所述線性域中使用所述第一組尺度參數處理所述譜表示,或者在所述類對數域中對所述第二組尺度參數進行內插以獲得內插的類對數域尺度因子,以及將所述類對數域尺度因子變換至線性域中以獲得所述第三組尺度參數。


    4.如前述權利要求之一所述的裝置,
    其中所述尺度參數計算器(110)被配置為針對非均勻頻帶計算所述第一組尺度參數,以及
    其中所述降采樣器(130)被配置為通過對具有所述第一組中的第一預定義數目的頻率鄰近尺度參數的第一群組進行組合來對所述第一組尺度參數進行降采樣,以獲得所述第二組中的第一尺度因子,以及其中所述降采樣器被配置為通過將具有所述第一組中的第二預定義數目的頻率鄰近尺度參數的第二群組進行組合來對所述第一組尺度參數進行降采樣,以獲得所述第二組中的第二尺度參數,其中所述第二預定義數目等于所述第一預定義數目,且其中所述第二群組具有的成員不同于所述第一預定義組的成員。


    5.如權利要求4所述的裝置,其中所述第一組中的頻率鄰近尺度參數的所述第一群組與所述第一組中的頻率鄰近尺度參數的所述第二群組共同地具有所述第一組中的至少一個尺度參數,以使得所述第一群組與所述第二群組彼此重疊。


    6.如前述權利要求之一所述的裝置,其中所述降采樣器(130)被配置為使用一群組的第一尺度參數之間的平均運算,所述群組具有兩個或更多個成員。


    7.如權利要求6所述的裝置,
    其中所述平均運算是加權平均運算,所述加權平均運算被配置為使得所述群組的中間處的尺度參數的權重高于所述群組的邊緣處的尺度參數的權重。


    8.如前述權利要求之一所述的裝置,
    其中所述降采樣器(130)被配置為執行均值移除(133),以使得所述第二組尺度參數是無均值的。


    9.如前述權利要求之一所述的裝置,
    其中所述降采樣器(130)被配置為在類對數域中使用低于1.0且大于0.0的尺度因子執行縮放操作(134)。


    10.如前述權利要求之一所述的裝置,
    其中所述尺度參數編碼器(140)被配置為使用向量量化器(141)對所述第二組進行量化和編碼,其中所述編碼表示包括用于一個或多個向量量化器碼本的一個或多個索引(146)。


    11.如前述權利要求之一所述的裝置,
    其中所述尺度因子編碼器(140)被配置為提供與所述編碼表示(142)相關聯的第二組量化的尺度因子,且
    其中所述譜處理器(120)被配置為從所述第二組量化的尺度因子(145)得出所述第二組尺度因子。


    12.如前述權利要求之一所述的裝置,
    其中所述譜處理器(120)被配置為確定所述第三組尺度參數,以使得所述第三數目等于所述第一數目。


    13.如前述權利要求之一所述的裝置,
    其中所述譜處理器(120)被配置為基于量化的尺度因子、以及所述量化的尺度因子與關于頻率按量化的尺度因子的遞升順序的下一量化的尺度因子之間的差,確定內插的尺度因子(121)。


    14.如權利要求13所述的裝置,
    其中所述譜處理器(120)被配置為依據所述量化的尺度因子以及所述差,確定至少兩個內插的尺度因子,其中針對兩個內插的尺度因子中的每一個,使用不同加權因子。


    15.如權利要求14所述的裝置,
    其中所述加權因子隨著與所述內插的尺度因子相關聯的頻率的增大而增大。


    16.如前述權利要求之一所述的裝置,
    其中所述譜處理器(120)被配置為在類對數域中執行所述內插操作(121),以及
    將內插的尺度因子轉換(122)至線性域中,以獲得所述第三組尺度參數。


    17.如前述權利要求之一所述的裝置,
    其中所述尺度參數計算器(110)被配置為針對每一頻帶計算振幅相關量度,以獲得一組振幅相關量度(111),以及
    對能量相關量度進行平滑(112),以獲得一組平滑的振幅相關量度作為所述第一組尺度因子。


    18.如前述權利要求之一所述的裝置,
    其中所述尺度參數計算器被配置為針對每一頻帶計算振幅相關量度,以獲得一組振幅相關量度,以及
    對所述一組振幅相關量度執行(113)預加重操作,其中所述預加重操作使得低頻振幅相對于高頻振幅被加重。


    19.如前述權利要求之一所述的裝置,
    其中所述尺度參數計算器(110)被配置為針對每一頻帶計算振幅相關量度,以獲得一組振幅相關量度,以及
    執行噪聲基底添加操作(114),其中噪聲基底是依據從所述譜表示的兩個或更多個頻帶作為均值得出的振幅相關量度來計算的。


    20.如前述權利要求之一所述的裝置,其中所述尺度因子計算器(110)被配置為執行一組操作中的至少一種,所述一組操作包括:針對多個頻帶計算(111)振幅相關量度,執行(112)平滑操作,執行(113)預加重操作,執行(114)噪聲基底添加操作,以及執行類對數域轉換操作(115)以獲得所述第一組尺度參數。


    21.如前述權利要求之一所述的裝置,
    其中所述譜處理器(120)被配置為使用所述第三組尺度因子對所述譜表示中的譜值進行加權(123)以獲得加權的譜表示,以及將時間噪聲整形(TNS)操作(124)應用于加權的譜表示,以及
    其中所述譜處理器(120)被配置為對所述時間噪聲整形操作(124)的結果進行量化(125)和編碼,以獲得所述譜表示的所述編碼表示。


    22.如前述權利要求之一所述的裝置,
    其中所述轉換器(100)包括用于產生加窗音頻樣本的區塊序列的分析窗口器(101),以及用于將加窗音頻樣本的所述區塊轉換為譜表示的序列的時間-譜轉換器(102),譜表示是譜框架。


    23.如前述權利要求之一所述的裝置,
    其中所述轉換器(100)被配置為應用MDCT(改進離散余弦變換)操作,以從時域樣本的區塊獲得MDCT譜,或者
    其中所述尺度因子計算器被配置為針對每一頻帶計算所述頻帶的能量,所述計算包括對譜線求平方、將平方的譜線相加、以及將平方的譜線除以所述頻帶中的線的數目,或者
    其中所述譜處理器(120)被配置為對所述譜表示的譜值進行加權(123),或者對根據頻帶方案從所述譜表示得出的譜值進行加權(123),所述頻帶方案與由所述尺度因子計算器(110)用于計算所...

    【專利技術屬性】
    技術研發人員:伊曼紐爾·拉維利馬庫斯·施奈爾康拉德·本多爾夫曼福萊特·盧次克馬丁·迪茨斯利坎特·科斯
    申請(專利權)人:弗勞恩霍夫應用研究促進協會
    類型:發明
    國別省市:德國;DE

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产日韩精品无码区免费专区国产| 蜜臀AV无码精品人妻色欲| 久久精品无码一区二区三区日韩| 国产成人精品一区二区三区无码| 精品无码一区二区三区爱欲九九| 国产乱人伦中文无无码视频试看| 亚洲午夜国产精品无码老牛影视| JAVA性无码HD中文| 久久久久亚洲精品无码网址| 一本色道无码道DVD在线观看 | 成在人线av无码免费高潮喷水| 亚洲中文字幕无码一去台湾| 最新中文字幕AV无码不卡 | 免费无码一区二区三区蜜桃 | 国产高新无码在线观看| AV无码久久久久不卡蜜桃| 免费一区二区无码东京热| 成人h动漫精品一区二区无码| 无码人妻精品一区二区三区东京热 | 人妻少妇精品无码专区漫画| 国产精品亚洲а∨无码播放| 国产日韩AV免费无码一区二区三区| 亚洲精品~无码抽插| 亚洲精品无码久久久久AV麻豆| 亚洲AV无码一区二区三区牲色| 久久精品岛国av一区二区无码| 丝袜无码一区二区三区| 国产成人无码精品久久久免费| 免费无码看av的网站| 无码视频一区二区三区| 亚洲aⅴ无码专区在线观看春色| 亚洲日韩av无码中文| 中文字幕乱偷无码av先锋蜜桃 | 久久精品无码一区二区app| 国语成本人片免费av无码| 久久水蜜桃亚洲AV无码精品| 蜜芽亚洲av无码一区二区三区| 18禁成年无码免费网站无遮挡| 九九在线中文字幕无码| 午夜无码视频一区二区三区| 国产精品无码一本二本三本色|