一種圖像編碼方法,其中圖像被分成了具有多個像素的塊。對像素塊執行變換編碼操作以便產生相應的變換系數值塊,其中對所述變換系數值塊進行掃描,以便產生一個經過掃描的系數值陣列,所述陣列由具有第一和第二數字的多個數字對表示。第一和第二數字指派到了表示所述數字對的多個上下文(14)之一。在這里,根據一個數字對的第一數字而將另一個數字對的第一數字指派給一個上下文。可替換地,一個數字對中的第二數字是基于數字對(16)中的第一數字而被指派給一個上下文的。此外還確定了一個指示變換系數值塊中非零系數值數目的數字,并且將其指派給一個上下文。(*該技術在2022年保護過期,可自由使用*)
【技術實現步驟摘要】
本專利技術一般地涉及靜止圖像和視頻序列壓縮,尤其涉及一種基于上下文的自適應二進制算術編碼方法和系統。
技術介紹
未壓縮形式的數字圖像包含了一個圖像像素或圖元的陣列。例如,在一種以四分之一通用中間格式(QCIF)著稱的常用數字圖像格式中,圖像或幀包含了排列在一個176×144像素的陣列中的25,344個像素。每個像素依次由一定數量的比特表示,它們傳送的是關于像素明亮度(亮度)和/或顏色(色度)的信息。此外還存在表示數字圖像中的亮度和/或色度的不同方案。通常使用的則是所謂的YUV顏色模型。其中亮度或Y分量表示像素亮度,并且像素顏色由U和V標記的兩個色度或色差分量來表示。此外還通常用到那些以表示光的三原色的分量為基礎的其他顏色模型,例如RGB(紅,綠,藍)顏色模型。然而,與基于原色的顏色模型相比,基于亮度/色度表示的顏色模型則更具優勢。這些優勢源自于人類視覺系統更易于感受到光亮變化而不是顏色變化的特性。而YUV顏色模型通常為色度分量(U,V)使用了一個低于亮度分量(Y)的空間分辨率,由此利用了這種特性。這樣就可以在不顯著降低所察覺圖像質量的情況下減少表示圖像色彩信息所需要的信息量。色度分量的較低空間分辨率通常是借助于二次抽樣來實現的。通常,一個16×16圖像像素的塊由四個包含了亮度信息的8×8像素的塊表示,相應色度分量分別由一個8×8像素的塊來表示,其中所述塊表示一個與亮度分量中的16×16像素的塊等價的圖像區域。因此色度分量在x和y方向上由一個大小為2的因數來進行空間二次抽樣。最終得到的四個8×8像素的亮度塊以及2個在空間上與之對應的8×8像素的色度塊的組合通常稱為一個YUV宏塊,或者簡稱為宏塊。而QCIF圖像包括11×9個宏塊。如果用8位(也就是0到255這個范圍中的數字)分辨率來表示亮度塊和色度塊,那么,用于表示與每個宏塊相關聯的亮度和色度信息所需要的總比特數為6×(8×8×8)=3072比特。因此,用于表示QCIF格式圖像所需要的比特數為99×3072=304,128比特。應該了解的是,即使是在如上所述使用一個大小為2的因數來對數字圖像的兩個色度分量進行二次抽樣的情況下,中等大小(例如174×144像素)的未壓縮圖像也會需要大量比特來供顯示所用。這意味著以未壓縮格式保存數字圖像所需要的存儲器數量將會過度。此外,舉例來說,如果經由一個具有中等或較低可用帶寬的數據通信網絡來傳送靜止圖像,那么傳輸時間將會很長或者網絡有可能會發生阻塞。如果希望實時發送作為數字視頻序列的一系列圖像,那么帶寬需求甚至會更為嚴格。例如,以每秒30幀的速率傳送一個使用了YUV顏色模型表示并包括一系列未壓縮QCIF格式圖像的數字序列需要用到9Mb/s(百萬比特/秒)以上的帶寬。由于需要很大的存儲器容量、傳輸信道容量和硬件性能,因此,在被用于視頻記錄、傳輸和顯示時,這種高數據速率通常是不切實際的。如果要在ISDN(綜合業務數字網)或PSTN(公共交換電話網)這類固定線路上實時傳送視頻序列,那么可用數據傳輸帶寬通常約為64k/s。在移動可視電話中,至少有一部分傳輸是在無線電通信鏈路上進行的,那么可用帶寬有可能會低到20kb/s。這意味著必須顯著減少用于表示視頻數據的信息量,以便能在低帶寬的通信網絡上傳輸數字圖像或視頻序列。然而合乎需要的是,這種減少應該在不顯著降低圖像/視頻序列質量的情況下實現。在過去數年中已經針對減少表示數字圖像和視頻序列所需數據量而進行了大量的研究工作,由此開發了多種不同方案和國際標準來對數字靜止圖像和數字視頻進行壓縮。在現有的幾乎所有靜止圖像和視頻編碼器中,所使用的基本的圖像壓縮方法都包含了基于塊的變換編碼。通常,變換編碼是將來自一個包含像素值的圖示的圖像數據轉換成一種包含一組系數值的形式,其中每一個系數值都是所論述變換的基函數的一個加權因數(乘數)。此外還可以顯示,在典型的數字圖像內部存在相當大程度的空間冗余。事實上,這意味著圖像內部任何像素值通常與其緊鄰的其他像素值實際是相同的,也就是說,在像素值間存在很大程度上的相關。此外進一步已知的是,在對圖像執行某些數學變換,例如二維離散余弦變換(DCT)的時候,這種空間冗余度將會顯著降低,由此產生一個更為簡潔的圖像數據顯示。在JPEG靜止圖像編碼中使用的基于塊的變換編碼例如,在根據廣泛使用的JPEG標準的基準模式所執行的靜止圖像壓縮中,所要編碼的圖像首先分成互不重疊的方形塊陣列,其中舉例來說,每一個塊都包括一個8×8的圖像像素陣列。然后,就JPEG基準而言則是將二維離散余弦變換(DCT)獨立應用于每一個圖像塊。這樣做具有把來自像素值域的圖像數據轉換到空間頻域并產生一組相應系數值的效果,其中每個系數值都是一個關于二維DCT基函數的加權因數。由此產生的系數值經過量化,然后使用熵編碼而以一種無損方式對其進行編碼,從而進一步減少供其顯示所需要的數據量(也就是比特數)。根據JPEG基準,熵編碼器只使用了霍夫曼編碼來產生一個壓縮比特流,但在其他模式中也可以使用算術編碼。最終,用于描述圖像和編碼參數(例如壓縮類型、量化和編碼表、圖像大小等等)的數據被嵌入熵編碼器產生的比特流中。而由于JPEG標準包括四種備選編碼模式并且只對可用的量化和編碼表安插了少量約束條件,因而有必要執行上述操作,以便能在不同平臺之間互換JPEG壓縮比特流并且在毫無歧義的情況下重建圖像。類似膠片上所記錄的常規電影這樣的數字視頻序列包括一系列靜止圖像(通常稱之為“幀”),而運動錯覺則是通過以通常為每秒15到30幀這樣的相對較快的速率相繼顯示所述幀而產生的。與任何靜止圖像一樣,在一個數字視頻序列內部,單獨幀的像素值將會顯示出相當大的空間冗余。因此,與單獨的靜止圖像一樣,數字視頻序列的幀也可以由基于塊的變換編碼來進行處理。同樣,視頻序列相鄰幀的圖像往往是相似的,因此,在某個視頻幀與下一視頻幀之間,整體上的變化是非常小的。這意味著在典型數字視頻序列內部存在相當大的時間冗余。例如,在一個場景中可以包括諸如背景景物之類的某些靜止元素,也可以包括某些運動區域,例如新聞廣播員面部。在序列的相鄰幀中,背景可能保持不變,而場景中的唯一運動則由新聞廣播員面部表情的變化產生。因此,在形成視頻序列的壓縮表示時,除了減少空間冗余的方法之外,也可以使用那些減少序列中圖像數據時間冗余的技術,由此實現進一步的數據壓縮。混合視頻編碼器/解碼器現有技術的視頻編碼系統使用了一種以運動補償預測著稱的技術來減少視頻序列中的時間冗余。就這種運動補償技術而言,在數字視頻序列中,某些(通常很多)幀的圖像內容是從序列中的一個或多個其他幀“預測”的,其中所述其他幀即為通常所說的“參考幀”。圖像內容的預測是通過使用“運動矢量”在將要編碼的幀與一個或多個參考幀之間追蹤一個圖像中的對象或區域來實現的。一般來說,在視頻序列中,一個或多個參考幀可以先于將要編碼的幀或是跟隨在所述幀之后。然而,從本文的后續論述中可以明顯看出,將運動補償預測應用于視頻序列的所有幀并由此在現有技術的視頻編碼系統中使用至少兩種類型的編碼,這樣做并不適當(或者可能)。使用運動補償預測而被壓縮的視頻序列幀通常稱為幀間編碼或P幀。光是運動補償預測則很難提供足夠清楚的視頻幀圖像內容表示,因此通本文檔來自技高網...
【技術保護點】
一種圖像編碼方法,其中,圖像被分成多個具有多個像素的塊,每一個像素都具有一個像素值,并且對像素塊執行變換編碼操作以便產生相應的變換系數值塊,所述方法的特征在于: 提供指示變換系數值塊中的非零系數值的數目的數字;以及 將所述數字指派給一個表示所述數字的上下文。
【技術特征摘要】
...
【專利技術屬性】
技術研發人員:M卡策維茨,R庫爾切倫,
申請(專利權)人:諾基亞有限公司,
類型:發明
國別省市:FI[芬蘭]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。