本發(fā)明專利技術(shù)提供一種圖形處理單元及其圖形處理方法。圖形處理單元的圖形處理方法包括:根據(jù)圖元數(shù)據(jù)與多個區(qū)塊的關(guān)聯(lián)來產(chǎn)生顯示區(qū)域的區(qū)塊數(shù)據(jù),其中,多個區(qū)塊對應(yīng)于顯示區(qū)域;根據(jù)偵測的自適應(yīng)條件來產(chǎn)生信號,其中,于第一幀被完全分級之前,信號指示第一幀的一個或多個區(qū)塊將以第一順序被刷新,其中,信號打斷以第二順序進(jìn)行的第二幀的區(qū)塊刷新;以第一順序刷新第一幀的一個或多個區(qū)塊;以及恢復(fù)以第二順序進(jìn)行的第二幀的區(qū)塊刷新。本發(fā)明專利技術(shù)提供的圖形處理單元及其圖形處理方法,可以防止或減輕渲染階段的失速,減少圖形處理總執(zhí)行時間,改善圖形處理單元的性能。
【技術(shù)實現(xiàn)步驟摘要】
【專利摘要】本專利技術(shù)提供一種。圖形處理單元的圖形處理方法包括:根據(jù)圖元數(shù)據(jù)與多個區(qū)塊的關(guān)聯(lián)來產(chǎn)生顯示區(qū)域的區(qū)塊數(shù)據(jù),其中,多個區(qū)塊對應(yīng)于顯示區(qū)域;根據(jù)偵測的自適應(yīng)條件來產(chǎn)生信號,其中,于第一幀被完全分級之前,信號指示第一幀的一個或多個區(qū)塊將以第一順序被刷新,其中,信號打斷以第二順序進(jìn)行的第二幀的區(qū)塊刷新;以第一順序刷新第一幀的一個或多個區(qū)塊;以及恢復(fù)以第二順序進(jìn)行的第二幀的區(qū)塊刷新。本專利技術(shù)提供的,可以防止或減輕渲染階段的失速,減少圖形處理總執(zhí)行時間,改善圖形處理單元的性能。【專利說明】
本專利技術(shù)關(guān)于圖形處理技術(shù),特別關(guān)于一種。【
技術(shù)介紹
】圖形處理單元(graphics processing unit,以下簡稱為GPU)于顯示裝置上處理并清染圖形對象(graphical object),例如:圖像元素(picture element)或像素。于計算機(jī)圖形中,3D圖形對象通常是由圖元(primitive)例如:點、線、多邊形、以及高階表面(higher order surface)的組合來表示。為了清染特定場景,圖元被單獨光柵化為像素的2D圖像。因為在復(fù)雜3D場景中常常有上千、上百萬、甚至是上億個的圖元,完成單獨對每個圖元的光柵化可能會導(dǎo)致次優(yōu)的(suboptimal)系統(tǒng)性能。因為光柵化處理是從一個圖元到下一個圖元,現(xiàn)有的圖形系統(tǒng)遭受著從存儲器中反復(fù)讀取以及寫入顏色及深度值。光柵化的像素的立即著色會導(dǎo)致不必要的處理開銷以及系統(tǒng)存儲器帶寬的整體低效。延遲渲染是關(guān)于多個圖元在渲染階段被渲染之前的累積,這些圖元可能來自一個場景中的多個圖形對象。延遲渲染的一個方法是將顯示空間分為多個區(qū)域。于一個幀的多個圖形對象中累積的圖元可以是一個區(qū)域接著一個區(qū)域被渲染,而不是一個圖元接著一個圖元被渲染,以減少存儲器的存取量。使用延遲渲染可以顯著地提高系統(tǒng)性能,尤其是在功耗及系統(tǒng)帶寬都很寶貴的移動裝置中。【
技術(shù)實現(xiàn)思路
】為了解決上述問題,本專利技術(shù)提出了一種。根據(jù)本專利技術(shù)的第一方面,提供一種圖形處理單元,包括:分級引擎,根據(jù)圖元數(shù)據(jù)與多個區(qū)塊的關(guān)聯(lián)來產(chǎn)生顯示區(qū)域的區(qū)塊數(shù)據(jù),其中,所述多個區(qū)塊對應(yīng)于所述顯示區(qū)域;渲染引擎,渲染所述顯示區(qū)域的所述區(qū)塊數(shù)據(jù);刷新控制器,根據(jù)偵測的自適應(yīng)條件來產(chǎn)生信號,其中,于第一幀被完全分級之前,所述信號指示來自分級緩沖器的所述第一幀的一個或多個區(qū)塊將以第一順序被刷新;以及分級控制器,耦接于所述分級引擎、所述渲染引擎、以及所述刷新控制器,控制所述分級緩沖器的存取,其中,于以第二順序進(jìn)行第二幀的區(qū)塊刷新的過程中,所述分級控制器被所述信號打斷以所述第一順序刷新所述第一幀的所述一個或多個區(qū)塊,以及恢復(fù)以所述第二順序進(jìn)行的所述第二幀的所述區(qū)塊刷新。根據(jù)本專利技術(shù)的第二方面,提供圖形處理單元的圖形處理方法,其特征在于,包括:根據(jù)圖元數(shù)據(jù)與多個區(qū)塊的關(guān)聯(lián)來產(chǎn)生顯示區(qū)域的區(qū)塊數(shù)據(jù),其中,所述多個區(qū)塊對應(yīng)于所述顯示區(qū)域;根據(jù)偵測的自適應(yīng)條件來產(chǎn)生信號,其中,于第一幀被完全分級之前,所述信號指示所述第一幀的一個或多個區(qū)塊將以第一順序被刷新,其中,所述信號打斷以第二順序進(jìn)行的第二幀的區(qū)塊刷新;以所述第一順序刷新所述第一幀的所述一個或多個區(qū)塊;以及恢復(fù)以所述第二順序進(jìn)行的所述第二幀的所述區(qū)塊刷新。本專利技術(shù)提供的,可以防止或減輕渲染階段的失速,減少圖形處理總執(zhí)行時間,改善GPU的性能。【【附圖說明】】圖1為根據(jù)本專利技術(shù)實施例的包括CPU以及GPU的圖形處理系統(tǒng)的示意圖。圖2為根據(jù)本專利技術(shù)實施例的GPU核心的示意圖。圖3為根據(jù)本專利技術(shù)實施例的由GPU核心執(zhí)行的延遲渲染過程的示意圖。圖4為根據(jù)本專利技術(shù)實施例的用于選擇區(qū)塊進(jìn)行搶占式刷新的方法的流程圖。圖5A為根據(jù)本專利技術(shù)實施例的被分段或分為3x3區(qū)塊的網(wǎng)格的顯示區(qū)域的示意圖。圖5B為根據(jù)本專利技術(shù)實施例的待渲染的幀的示意圖。圖6A至圖6D為根據(jù)本專利技術(shù)實施例的幀的搶占式刷新的過程示意圖。圖7為根據(jù)本專利技術(shù)實施例的空間選擇性分級的搶占式刷新方法的流程圖。【【具體實施方式】】下面的描述是實施本專利技術(shù)的較佳預(yù)期模式。這種描述是為了說明本專利技術(shù)的一般原理的目的,而不應(yīng)被理解成具有限制性的意義。但是應(yīng)當(dāng)理解,實施例可以利用軟件、硬件、固件、或其任何組合來實現(xiàn)。在以下的描述中,闡述了很多具體細(xì)節(jié)。然而,可以理解的是,本專利技術(shù)的實施例可以在沒有這些具體細(xì)節(jié)的情況下實施。在其它實例中,公知的電路、結(jié)構(gòu)以及技術(shù)沒有被詳細(xì)的示出,以便不模糊對此描述的理解。然而,本領(lǐng)域的普通技術(shù)人員可以理解的是,本專利技術(shù)可以在沒有這些具體細(xì)節(jié)的情況下實施。本領(lǐng)域的普通技術(shù)人員利用所包括的描述,無需過多的實驗就能夠?qū)崿F(xiàn)適當(dāng)?shù)墓δ堋1緦@夹g(shù)是有關(guān)于圖形處理系統(tǒng);特別是是關(guān)于延遲圖形處理(deferred graphicsprocessing)。有限的存儲器帶寬是增強(qiáng)現(xiàn)有的3D圖形管線的性能的一個主要的障礙。如先前所描述的,延遲渲染可以減少3D圖形管線中的存儲器帶寬的需求。延遲渲染的一個方法包括兩個階段。第一階段是分級階段(binning pass),于分級階段中,幀的圖元被分類為(或等效于“相關(guān)于”)一組區(qū)塊(a set of bins)。這些區(qū)塊包括將在顯示空間中被渲染的區(qū)塊數(shù)據(jù)(bin data)。顯示空間是空間或區(qū)域,在顯示空間中一系列的幀待渲染。顯示空間被分段為規(guī)則網(wǎng)格的區(qū)塊區(qū)域(bin area)(例如,32像素x 32像素或其它合適的大小),每個區(qū)塊區(qū)域顯示對應(yīng)區(qū)塊的已渲染的區(qū)塊數(shù)據(jù)。第二階段為渲染階段,于渲染階段,區(qū)塊數(shù)據(jù)逐區(qū)塊被渲染。通過在一個時間渲染一個區(qū)塊的數(shù)據(jù),位于相同區(qū)塊的多個圖形對象的圖元數(shù)據(jù)可以在相同的階段被處理,這樣就可以進(jìn)行有效率的數(shù)據(jù)存取。因此,一般而言,延遲渲染可以提高系統(tǒng)性能。現(xiàn)有技術(shù)中,在進(jìn)行渲染處理之前,區(qū)塊數(shù)據(jù)是臨時儲存在存儲器中。于某些系統(tǒng)中,存儲器是附屬于GPU的動態(tài)隨機(jī)存取存儲器(dynamic random-access memory,以下簡稱為DRAM)。于某些系統(tǒng)中,DRAM可以由GPU以及CPU來共用。可以指定存儲器的一部分來儲存區(qū)塊數(shù)據(jù)。然而,于現(xiàn)有的系統(tǒng)中,于對幀分級的中間,此存儲器的指定部分可能達(dá)到其最大容量,且整個幀被刷新到渲染硬件,以開始立即渲染。整個幀刷新的代價是很昂貴的,因為它失去了關(guān)于存儲器I/O存儲的延遲渲染的優(yōu)點。S卩,刷新沒有被分級的圖元,其結(jié)果是整個幀的刷新是按照對逐個圖元進(jìn)行渲染來處理的,而不是對逐個區(qū)塊進(jìn)行渲染。因此,存儲器I/O開銷將增加,且系統(tǒng)性能將顯著地降低。現(xiàn)有的GPU系統(tǒng)還會受到渲染硬件的不均衡工作負(fù)載(workload)分布的影響。因為從分級硬件反饋的區(qū)塊數(shù)據(jù)不足,渲染硬件可能會不時地停止。例如,當(dāng)一個幀的圖元都集中在少數(shù)幾個區(qū)塊,分級硬件就需要花較長的時間段來完成一個區(qū)塊的處理,并將該區(qū)塊的區(qū)塊數(shù)據(jù)輸出到渲染硬件。在這個時間段,渲染硬件可能會停止或利用不足(under-utilized)。導(dǎo)致高度集中區(qū)塊的一個場景是鑲嵌(tessellat1n)。當(dāng)圖形對象被鑲嵌,圖形對象被表示為很多小的圖元,這些圖元通常是群集于局部區(qū)塊。于現(xiàn)有的系統(tǒng)中,這些高度集中區(qū)塊不僅會導(dǎo)致臨時的工作負(fù)載失衡,還可能占用很多存儲器容量,進(jìn)而又會導(dǎo)致降低系統(tǒng)性能本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點】
一種圖形處理單元,其特征在于,包括:分級引擎,根據(jù)圖元數(shù)據(jù)與多個區(qū)塊的關(guān)聯(lián)來產(chǎn)生顯示區(qū)域的區(qū)塊數(shù)據(jù),其中,所述多個區(qū)塊對應(yīng)于所述顯示區(qū)域;渲染引擎,渲染所述顯示區(qū)域的所述區(qū)塊數(shù)據(jù);刷新控制器,根據(jù)偵測的自適應(yīng)條件來產(chǎn)生信號,其中,于第一幀被完全分級之前,所述信號指示來自分級緩沖器的所述第一幀的一個或多個區(qū)塊將以第一順序被刷新;以及分級控制器,耦接于所述分級引擎、所述渲染引擎、以及所述刷新控制器,控制所述分級緩沖器的存取,其中,于以第二順序進(jìn)行第二幀的區(qū)塊刷新的過程中,所述分級控制器被所述信號打斷以所述第一順序刷新所述第一幀的所述一個或多個區(qū)塊,以及恢復(fù)以所述第二順序進(jìn)行的所述第二幀的所述區(qū)塊刷新。
【技術(shù)特征摘要】
...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:呂堅平,廖群峰,黃錫霖,趙夏陽,
申請(專利權(quán))人:聯(lián)發(fā)科技新加坡私人有限公司,
類型:發(fā)明
國別省市:新加坡;SG
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。