本發(fā)明專利技術(shù)公開了一種非矩形視頻編碼方法及裝置,該方法包括:判斷視頻是否為矩形,若不是矩形,則將視頻填充為矩形;描述視頻的大小;描述視頻的形狀;將描述視頻的大小和形狀數(shù)據(jù)作為編碼數(shù)據(jù)的一部分,將其作為一部分寫入到編碼輸出的碼流以及編碼輸出的壓縮文件中;利用矩形視頻編碼的方法編碼上述填充后的矩形視頻,通過本發(fā)明專利技術(shù),可以保持各視頻塊之間的相鄰關(guān)系,從而提高壓縮效率。
Non rectangular video coding method and device
The invention discloses a device and a non rectangular video encoding method, the method includes: judging whether the video is a rectangle, if not rectangular, the video filled rectangular; describe the size of the video; describe the shape of the video; video will describe the size and shape of the data as part of a series of code data, as the a part written to the output stream encoding and compression file encoding output; using the method of video encoding the rectangle filled rectangular video, the invention can maintain the relationship between the neighboring video blocks, so as to improve the compression efficiency.
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及視頻編解碼
,特別是涉及一種非矩形視頻編碼方法及裝置。
技術(shù)介紹
全景視頻是指空間中一個觀察點四周所有的場景,由這個觀察點所能接收到的所有光線構(gòu)成。全景視頻可以抽象成一個以觀察點為中心的球面。在用計算機(jī)處理全景視頻的時候,不可避免地要對全景視頻進(jìn)行離散化空間采樣。在對全景視頻進(jìn)行離散化空間采樣的時候,需要保證一定的空間采樣密度,以達(dá)到所需的清晰度。同時,又要考慮到計算機(jī)的存儲器不適合存儲球面結(jié)構(gòu)的數(shù)據(jù),需要以某種方式把采樣點排列到平面上。常用的全景視頻采樣方法中,有經(jīng)緯圖采樣、六面體采樣等。其中,經(jīng)緯圖采樣得到一個寬高比為2:1的矩形視頻,這正是傳統(tǒng)視頻編解碼處理的視頻格式,非常便于后續(xù)的壓縮編碼、解碼處理,但是,經(jīng)緯圖采樣方法在球面的兩極區(qū)域采樣密度過大,帶來了很大的數(shù)據(jù)冗余,會降低后續(xù)壓縮編碼的壓縮效率。六面體采樣得到的是六個正方形的視頻。如果按照相鄰關(guān)系排列,則構(gòu)成非矩形形狀的平面視頻,如圖1(圖1(a)及圖1(b))所示。這些非矩形形狀的視頻不能直接作為傳統(tǒng)視頻編碼系統(tǒng)的輸入源。為了能夠利用傳統(tǒng)的視頻編碼系統(tǒng)編碼用六面體采樣方法得到的全景視頻,需要把六個正方形的視頻拼接成矩形視頻,如圖2(圖2(a)-圖2(d))所示。然而,圖2(圖2(a)-圖2(d))所示的拼接會移動視頻塊的位置,相鄰塊的相關(guān)性被破壞,編碼時不能利用這些相關(guān)性進(jìn)行壓縮編碼,壓縮效率不高。
技術(shù)實現(xiàn)思路
為克服上述現(xiàn)有技術(shù)存在的不足,本專利技術(shù)之目的在于提供一種非矩形視頻編碼方法及裝置,其可以保持各視頻塊之間的相鄰關(guān)系,從而提高壓縮效率。為達(dá)上述及其它目的,本專利技術(shù)提出一種一種非矩形視頻編碼方法,包括如下步驟:步驟一,判斷視頻是否為矩形,若不是矩形,則將視頻填充為矩形;步驟二,描述視頻的大小;步驟三,描述視頻的形狀;步驟四,將描述視頻的大小和形狀數(shù)據(jù)作為編碼數(shù)據(jù)的一部分,將其作為一部分寫入到編碼輸出的碼流以及編碼輸出的壓縮文件中;步驟五,利用矩形視頻編碼的方法編碼上述填充后的矩形視頻。進(jìn)一步地,于步驟一中,將視頻填充為一個長和寬都是某個整數(shù)的倍數(shù)的最小矩形。進(jìn)一步地,于步驟二中,所述描述視頻的大小是在平面直角坐標(biāo)系上,以視頻所包含像素的最小水平間隔作為水平坐標(biāo)軸的單位,以視頻所包含像素的最小垂直間隔作為垂直坐標(biāo)軸的單位,以平面上的某個位置為坐標(biāo)原點,使視頻所包含的每一個像素都有一個整數(shù)坐標(biāo)。進(jìn)一步地,所述視頻的大小包括兩個分量,一個是水平分量,在數(shù)值上等于視頻所包含像素的最大橫坐標(biāo)減去視頻所包含像素的最小橫坐標(biāo),另一個是垂直分量,在數(shù)值上等于視頻所包含像素的最大縱坐標(biāo)減去視頻所包含像素的最小縱坐標(biāo)。進(jìn)一步地,于步驟三中,所述視頻的形狀是指視頻所包含的全部像素對應(yīng)的平面直接坐標(biāo)系上的點構(gòu)成的區(qū)域的形狀。進(jìn)一步地,于步驟三中,采用分類描述方法描述視頻的形狀。為達(dá)到上述目的,本專利技術(shù)還提供一種非矩形視頻編碼裝置,包括:矩形填充單元,用于判斷視頻是否為矩形,若不是矩形,則將視頻填充為矩形;大小描述單元,用于描述視頻的大小;形狀描述單元,用于描述視頻的形狀;寫入單元,用于將描述視頻的大小和形狀數(shù)據(jù)作為編碼數(shù)據(jù)的一部分,將其作為一部分寫入到編碼輸出的碼流以及編碼輸出的壓縮文件中;編碼單元,利用矩形視頻編碼的方法編碼上述填充后的矩形視頻。進(jìn)一步地,所述大小描述單元在平面直角坐標(biāo)系上,以視頻所包含像素的最小水平間隔作為水平坐標(biāo)軸的單位,以視頻所包含像素的最小垂直間隔作為垂直坐標(biāo)軸的單位,以平面上的某個位置為坐標(biāo)原點,使視頻所包含的每一個像素都有一個整數(shù)坐標(biāo)。進(jìn)一步地,所述視頻的大小包括兩個分量,一個是水平分量,在數(shù)值上等于視頻所包含像素的最大橫坐標(biāo)減去視頻所包含像素的最小橫坐標(biāo),另一個是垂直分量,在數(shù)值上等于視頻所包含像素的最大縱坐標(biāo)減去視頻所包含像素的最小縱坐標(biāo)。進(jìn)一步地,所述視頻的形狀是指視頻所包含的全部像素對應(yīng)的平面直接坐標(biāo)系上的點構(gòu)成的區(qū)域的形狀。與現(xiàn)有技術(shù)相比,本專利技術(shù)一種非矩形視頻編碼方法及裝置用于全景視頻的壓縮編碼時,不需要對采樣后獲得的多個視頻塊進(jìn)行變換和拼接,從而使各視頻塊保持很好的相鄰相關(guān)性,編碼時可以利用這些相關(guān)性提高壓縮效率。附圖說明圖1(a)、圖1(b)、圖1(c)為六面體采樣后按照相鄰關(guān)系展開得到的非矩形視頻及填充后的矩形視頻;圖2(a)、圖2(b)、圖2(c)及圖2(d)為將六面體采樣得到的六個正方形排列成矩形的幾種典型方式;圖3為全景視頻六面體采樣得到的六個面的一種排列方式;圖4為本專利技術(shù)一種非矩形視頻編碼方法的步驟流程圖;圖5為本專利技術(shù)一種非矩形視頻編碼裝置的系統(tǒng)架構(gòu)圖。具體實施方式以下通過特定的具體實例并結(jié)合附圖說明本專利技術(shù)的實施方式,本領(lǐng)域技術(shù)人員可由本說明書所揭示的內(nèi)容輕易地了解本專利技術(shù)的其它優(yōu)點與功效。本專利技術(shù)亦可通過其它不同的具體實例加以施行或應(yīng)用,本說明書中的各項細(xì)節(jié)亦可基于不同觀點與應(yīng)用,在不背離本專利技術(shù)的精神下進(jìn)行各種修飾與變更。圖4為本專利技術(shù)一種非矩形視頻編碼方法的步驟流程圖。如圖3所示,本專利技術(shù)一種非矩形視頻編碼方法,包括如下步驟:步驟401,判斷視頻是否為矩形,若不是矩形,則將視頻填充為一個矩形。本步驟中將視頻填充為一個矩形,是根據(jù)后續(xù)編碼的方便,將視頻填充為一個長和寬都是某個整數(shù)(例如16或64)的倍數(shù)的最小矩形。步驟402,描述視頻的大小。其中,如果原視頻不是矩形,則描述填充后矩形的大小。這里所述的描述視頻的大小,指的是在平面直角坐標(biāo)系上,以視頻所包含像素的最小水平間隔作為水平坐標(biāo)軸的單位,以視頻所包含像素的最小垂直間隔作為垂直坐標(biāo)軸的單位,以平面上的某個位置為坐標(biāo)原點,使視頻所包含的每一個像素都有一個整數(shù)坐標(biāo)。所說的視頻的大小包括兩個分量,其中一個是水平分量,在數(shù)值上等于視頻所包含像素的最大橫坐標(biāo)減去視頻所包含像素的最小橫坐標(biāo),另一個是垂直分量,在數(shù)值上等于視頻所包含像素的最大縱坐標(biāo)減去視頻所包含像素的最小縱坐標(biāo)步驟403,描述視頻的形狀。這里所述的視頻的形狀,指的是視頻所包含的全部像素對應(yīng)的平面直接坐標(biāo)系上的點構(gòu)成的區(qū)域的形狀。本專利技術(shù)將視頻的形狀限定為單連通區(qū)域。本步驟所述的視頻的形狀,可以用任何能夠準(zhǔn)確描述該形狀的方法進(jìn)行描述,本專利技術(shù)采用分類描述,并給出若干典型形狀的描述方法,以后遇到新的形狀,可以根據(jù)需要定義新的形狀類型和描述方法。對于如圖1所示的全景視頻經(jīng)過六面體采樣得到的非矩形視頻,按照如下表1的方式描述:表1其中,shape_category占用8個比特,即一個字節(jié),表示形狀的類別。規(guī)定shape_category的值為1表示六面體采樣后獲得的如圖1所示的形狀,該形狀由4×3的方格構(gòu)成。每個方格中要么是六面體的某個面,要么是填充數(shù)據(jù)。規(guī)定shape_category的值為2表示六面體采樣后獲得的如圖2(a)或(b)所示的形狀,該形狀由3×2的方格構(gòu)成。每個方格中是六面體的某個面。這兩種形狀的描述方法相同。其中,i表示面的編號,取值為0到5。i并不在編碼數(shù)據(jù)中出現(xiàn),這里是為了表達(dá)方便,引入的臨時符號,for循環(huán)表示關(guān)于面的描述會出現(xiàn)多次。六面體采樣一共獲得6個面,為它們編號如下表2:表2面的名稱前后左右上下面的編號012345position占用6個比特,表示第i個面所本文檔來自技高網(wǎng)...

【技術(shù)保護(hù)點】
一種非矩形視頻編碼方法,包括如下步驟:步驟一,判斷視頻是否為矩形,若不是矩形,則將視頻填充為矩形;步驟二,描述視頻的大小;步驟三,描述視頻的形狀;步驟四,將描述視頻的大小和形狀數(shù)據(jù)作為編碼數(shù)據(jù)的一部分,將其作為一部分寫入到編碼輸出的碼流以及編碼輸出的壓縮文件中;步驟五,利用矩形視頻編碼的方法編碼上述填充后的矩形視頻。
【技術(shù)特征摘要】
1.一種非矩形視頻編碼方法,包括如下步驟:步驟一,判斷視頻是否為矩形,若不是矩形,則將視頻填充為矩形;步驟二,描述視頻的大小;步驟三,描述視頻的形狀;步驟四,將描述視頻的大小和形狀數(shù)據(jù)作為編碼數(shù)據(jù)的一部分,將其作為一部分寫入到編碼輸出的碼流以及編碼輸出的壓縮文件中;步驟五,利用矩形視頻編碼的方法編碼上述填充后的矩形視頻。2.如權(quán)利要求1所述的一種非矩形視頻編碼方法,其特征在于:于步驟一中,將視頻填充為一個長和寬都是某個整數(shù)的倍數(shù)的最小矩形。3.如權(quán)利要求2所述的一種非矩形視頻編碼方法,其特征在于:于步驟二中,所述描述視頻的大小是在平面直角坐標(biāo)系上,以視頻所包含像素的最小水平間隔作為水平坐標(biāo)軸的單位,以視頻所包含像素的最小垂直間隔作為垂直坐標(biāo)軸的單位,以平面上的某個位置為坐標(biāo)原點,使視頻所包含的每一個像素都有一個整數(shù)坐標(biāo)。4.如權(quán)利要求3所述的一種非矩形視頻編碼方法,其特征在于:所述視頻的大小包括兩個分量,一個是水平分量,在數(shù)值上等于視頻所包含像素的最大橫坐標(biāo)減去視頻所包含像素的最小橫坐標(biāo),另一個是垂直分量,在數(shù)值上等于視頻所包含像素的最大縱坐標(biāo)減去視頻所包含像素的最小縱坐標(biāo)。5.如權(quán)利要求4所述的一種非矩形視頻編碼方法,其特征在于:于步驟三中,所述視頻的形狀是指視頻所包含的全部像素對應(yīng)的平面直接坐標(biāo)系上的點構(gòu)成的區(qū)域...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陳大鵬,陳芳,陳智賢,林暢,顧曉,吳成家,趙海武,
申請(專利權(quán))人:上海國茂數(shù)字技術(shù)有限公司,
類型:發(fā)明
國別省市:上海;31
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。