本發明專利技術公開了使用列的圖像分割方法和系統。描述了在視頻編碼和解碼中通過列和片的圖像分割。將視頻圖像分割成多個列,每個列僅在水平維度中覆蓋視頻圖像的一部分。屬于一個片的全部編碼樹塊(“CTB”)可能屬于一個或多個列。列可用于破壞視頻編碼的相同的或不同的預測或環路濾波機制,并且用于編碼和/或解碼的CTB掃描次序可以是局部用于列的。可以在參數集合中指示并且/或者可以在片等級調整列寬度。在解碼器處,可以從比特流解析列寬度,并且片解碼可以發生在一個或多個列中。
【技術實現步驟摘要】
使用列的圖像分割方法和系統本申請是申請日為2011年12月28日、題為“使用列的圖像分割方法和系統”的專利技術專利申請201180062299.8的分案申請。本申請要求2010年12月28日提交的、標題為"PICTURESEGMENTATIONUSINGGENERALIZEDSLICES”的美國臨時專利申請序列號61/427,569以及2011年12月23日提交的、標題為“METHODANDSYSTEMFORPICTURESEGMENTATIONUSINGCOLUMNS”的美國專利申請號13/336,675的優先權,以引用的方式將以上每個申請的全文并入本申請中。
本專利技術的實施方式涉及視頻編碼,并且更具體而言涉及將編碼圖像分割成一個或多個列或片。
技術介紹
可以將數字視頻能力包括在范圍廣泛的設備中,包括數字電視機、數字直接廣播系統、無線廣播系統、個人數字助理(PDA)、膝上型計算機或桌上型計算機、攝像機、數字記錄設備、視頻游戲設備、視頻游戲控制臺、蜂窩或衛星無線電話等等。數字視頻設備可以實現視頻壓縮技術,如諸如MPEG-2、MPEG-4的標準中所述的那些視頻壓縮技術,其中,可以從位于瑞士CH—1211日內瓦20,郵政信箱56,Voie-Creuse第一大道的國際標準組織(“ISO”)或www.iso.org或ITU-TH.264/MPEG-4第十部分,高級視頻編碼(“AVC”)獲得,從位于瑞士CH-1211日內瓦20萬國宮廣場的國際電信聯盟(“ITU'’)或www.im.int獲得MPEG-2、MPEG-4標準,以引用的方式將以上每個標準的全文并入本申請中,或者根據其他標準或非標準規范實現視頻壓縮技術,以有效地編碼并且/或者解碼數字視頻信息。視頻編碼器可以接收未編碼視頻信息以便處理成任意合適的格式,該格式可以是符合(可從位于瑞士CH-1211日內瓦20萬國宮廣場的國際電信聯盟(“ITU'’)或wvw.訌u.int獲得的并且以引用的方式全文并入本申請的)ITU-RBT6016勺數字格式或者一些其他數字格式。可以將未編碼視頻在空間上組織成配置在一個或多個二維矩陣中的像素值并且在時間上組織成一系列未編碼圖像,其中,每個未編碼圖像包括一個或多個上述提到的二維像素值矩陣。此外,每個像素可以包括用于以數字格式表示色彩的多個獨立的分量。用于被輸入到視頻編碼器的未編碼視頻的一個常用格式對于具有四個像素的每個分組具有四個輝度樣本和兩個色度樣本,其中,該輝度樣本包括關于像素的亮度/光亮或黑暗的信息,該色度樣本包括顏色信息(例如YCrCb4:2:0)。視頻編碼器的一種功能是將未編碼圖像轉譯(更普遍而言“轉換”)成比特流、分組流、NAL單元流或其他合適的傳輸格式(全都被在今后稱為“比特流”),其目標在于例如降低編碼到比特流中的冗余的數量以由此增加傳輸速率,增加比特流的恢復能力以抑制在傳輸期間可能發生的比特錯誤或分組擦除(統稱為“差錯恢復能力”)或其他專用目標。本專利技術的實施方式具備以下之中的至少一個:冗余的去除或降低、差錯恢復能力的增加以及并行處理架構中的視頻編碼器和/或相關解碼器的實現。視頻解碼器的一個功能在于接收由符合相同的視頻壓縮標準的視頻編碼器產生的比特流形式的編碼視頻作為它的輸入。視頻編碼器然后將接收編碼比特流轉譯(更普遍而言“轉換”)成可以被顯示、存儲或以其它方式處理的未編碼視頻信息。可以使用包括硬件和軟件的組合的硬件和/或軟件配置實現視頻編碼器和視頻解碼器。視頻編碼器和視頻解碼器中的任意一個或兩個的實現可以包括可編程硬件組件如(如個人計算機(PC)中發現的那些)通用中央處理器CPU、嵌入式處理器、圖形卡處理器、數字信號處理器(DSP)、現場可編程門陣列(FPGA)等等的使用。為了實現視頻編碼或解碼的至少一部分,可能需要指令,并且可以使用一個或多個非瞬態的計算機可讀介質存儲并且分配那些指令。計算機可讀介質選擇包括壓縮盤只讀存儲器(CD-ROM)、數字視頻盤只讀存儲器(DVD-ROM)、記憶棒、嵌入式ROM等等。在下文中,將描述與視頻壓縮和解壓縮的至少一個廣義方案(即視頻編碼器和/或解碼器中執行的操作)關聯的特定系統、方法和/或方案。視頻解碼器可以執行與編碼操作相逆的操作的全部或子集。若非另外注釋,則本文所述的視頻編碼技術還適用于包括所述視頻編碼技術的逆向(即與視頻解碼相關聯)。可以將未壓縮的數字表示的視頻視為樣本流,其中,可以由視頻顯示器在掃描次序中處理樣本。在該樣本流中通常出現的一種類型的邊界是樣本流的圖像之間的邊界。許多視頻壓縮標準識別該邊界并且通常例如通過在每個未編碼圖像的開頭插入圖像報頭或其他元數據來分割在這些邊界上的編碼比特流。對于一些應用,將編碼圖像分割成更小的數據塊可能是有利的,其中,該分割可以發生在編碼之前或期間。下文描述了可以受益于圖像分割的兩個使用情況。第一種該使用情況涉及并行處理。在以前,標清視頻(例如720x480或720x576個像素)是廣泛的商業使用中的最大格式。最近,出現并且在各種各樣的應用空間使用(高達1920x1080個像素的)HD格式以及4k(4096x2048個像素)、8k(8192x4096個像素)以及更大的格式。盡管近些年來可負擔的計算能力增加,但是由于與這些更新的或更大的格式中的一些格式相關聯的的非常大的圖像尺寸,調節并行處理的效率對編碼并且解碼過程通常是有利的。并行編碼和解碼可以發生在指令等級(例如使用SIMD)、在可以在不同階段上同時處理多個視頻編碼單元的流水線中或者在由獨立的計算引擎作為獨立的實體(例如多核通用處理器)來處理視頻編碼子單元的集合的大型結構基礎上。并行處理的最后一個形式需要圖像分割。第二種該使用情況涉及圖像分割以便創建適用于在分組網絡上的有效傳輸的比特流。基于IP或其他分組網絡協議來傳輸編碼視頻的編解碼器可能受到最大傳輸單元(“MTU”)尺寸限制。對于編碼片尺寸而言,有時候包括編碼片的結果分組盡可能地接近MTU尺寸而不超過該尺寸是有利的,以便保持高的有效載荷/分組化開銷比率,同時避免被網絡分段(以及結果導致的更高的損失概率)。MTU尺寸在一個網絡到另一個網絡之間變化很大。例如,可以由通常用于因特網的網絡基礎設施的最小MTU尺寸設置許多因特網連接的MTU尺寸,其中,該最小MTU尺寸通常對應于以太網中的極限并且可以大致為1500個字節。編碼圖像中的比特的數量依賴于許多因素如源圖像的尺寸、希望的質量、就預測適宜性而言的內容復雜度、視頻編碼標準的編碼效率以及其他因素。然而,即使在適中的設置質量和內容復雜度上,對于HD分辨率以及更高分辨率的序列,平均編碼圖像的尺寸輕易地超過MTU尺寸。視頻會議編碼器可能例如需要大約2Mbit/sec,以編碼720p60視頻序列。這導致大致33000比特或4215字節的平均編碼圖像尺寸,這比因特網的MTU尺寸的近似1500個字節多相當多。在更高的分辨率上,平均圖像尺寸增加到顯著高于因特網的MTU尺寸的值。假設與以上720p60中類似的壓縮比,60fps上的4096x2048(4k)視頻(4kp60)可能對于每個編碼視頻圖像需要超過300000個比特或25個MUT大小的分組。在許多視頻編碼標準中,圖像段(或至少一種形式的本文檔來自技高網...

【技術保護點】
一種用于編碼視頻圖像的方法,所述視頻圖像包括被配置成至少兩個CTB行和至少兩個CTB列的多個編碼樹塊CTB,所述方法包括:編碼列中的每個列的對應的列寬度,每個列寬度大于零并且所有列寬度的和等于所述視頻圖像的水平尺寸;并且編碼所述視頻圖像的至少一個片,其中,所述至少一個片包括位于至少兩個CTB行中的至少兩個CTB,其中,列從圖像上部去到圖像下部,并且列寬度從圖像上部到圖像下部是均勻的;其中,該圖像從最左邊的列到最右邊的列被掃描;并且其中,在緊接第一列右邊的第二列的CTB被掃描之前,第一列內的全部CTB從左到右并且從上到下被掃描;其中,編碼所述視頻圖像的至少一個片包括對片中的塊進行變換。
【技術特征摘要】
2010.12.28 US 61/427,569;2011.12.23 US 13/336,6751.一種用于編碼視頻圖像的方法,所述視頻圖像包括被配置成至少兩個CTB行和至少兩個CTB列的多個編碼樹塊CTB,所述方法包括:編碼列中的每個列的對應的列寬度,每個列寬度大于零并且所有列寬度的和等于所述視頻圖像的水平尺寸;并且編碼所述視頻圖像的至少一個片,其中,所述至少一個片包括位于至少兩個CTB行中的至少兩個CTB,其中,列從圖像上部去到圖像下部,并且列寬度從圖像上部到圖像下部是均勻的;其中,該圖像從最左邊的列到最右邊的列被掃描;并且其中,在緊接第一列右邊的第二列的CTB被掃描之前,第一列內的全部CTB從左到右并且從上到下被掃描;其中,編碼所述視頻圖像的至少一個片包括對片中的塊進行變換。2.如權利要求1所述的方法,進一步包括將列的數量和列的寬度中的至少一個編碼到參數集合中。3.一種用于解碼編碼視頻圖像的方法,所述編碼視頻圖像包括被配置成至少兩個CTB行和至少兩個CTB列的多個編碼樹塊CTB,所述方法包括:獲得(i)列中的每個列的對應的列寬度或(ii)列數量中的至少一個;導出列中的每個列的所述對應的列寬度;并且解碼所述編碼視頻圖像的至少一個片,其中,所述至少一個片包括位于至少兩個CTB行中的至少兩個CTB,其中...
【專利技術屬性】
技術研發人員:邁克爾·霍羅威茨,
申請(專利權)人:杜比國際公司,
類型:發明
國別省市:荷蘭,NL
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。