本發明專利技術描述一種在圖形處理單元中提高效能的系統和方法。實施方式通過在包含多個SIMD單元的著色器復合器中動態地激活/停用單個的SIMD實現在圖形處理單元中的功率節約。單個SIMD的動態即時禁用和啟用對于給定的處理應用中實現所需的效能和功率水平提供了靈活性。用這種方法,實施方式實現了圖形處理單元的最優化使用。本發明專利技術的實施方式還在著色器復合器中實現SIMD的動態紋理(如中等紋理)時鐘門控。實施方式通過按需提供時鐘機制,關閉未使用的邏輯時鐘樹,以減少開關功率。用這種方法,實施方式增強時鐘門控,以在SIMD為空閑(或未指派任何工作)時的持續時間內節約更多的開關功率。
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術的實施方式總體涉及在圖形處理單元(GPU)中的單指令多數據(SMD)單元的控制。
技術介紹
圖形處理器的算術單元包括算術邏輯單元(ALU)或配置為執行整數、邏輯和單/雙精度浮點運算的算術單元。圖形處理器可以包括成陣列的如被稱為著色器核心的算術單元。著色器核心包括著色器管線(SP)。為了實現更高的效能,多個SP可以被配置為作為疊式SP—起工作。SP可以配置為成陣列的四芯管(QP)和SMD。每個SMD的所有的著色器單元在不同組的原點、頂點或像素值上可以有條件地執行相同的ALU指令。以這種方式,SMD提供算術處理功率到圖形處理器。在傳統的具有疊式SP的圖形處理器中,可以靜態地啟用或禁用SMD。例如,如果SP被確定為有故障,引線掩碼(fuse mask)可以被編程為禁用故障SP。相似地,用戶可存取寄存器可以被編程為禁用/啟用特定的SMD或成組的SMD。然而,在新的工作請求發送到SMD之前,這種方法需要圖形處理器的圖形管道刷新,且需要將新值重新編程到刷新的圖形管道中。通常的假設是隨著SMD數量的相應增加,著色器引擎的效能提高。然而,這種陳述僅僅在有限的情況下是真實的,如在繁重的工作負荷條件下。對于經常出現的情況,在較少繁重的工作負荷的情況下,著色器引擎的效能不一定隨著SIMD的數目的增加而增加。在這種情況下,如果所有的SMD被啟用,由于未充分利用的SMD (即SMD具有較輕的負荷或沒有負荷)保持啟用和激活狀態,所以功率被浪費。傳統的圖形系統簡單地將工作負荷在遍布于所使用的著色器引擎內的所有的SMD進行劃分以用于特定的操作。然而,這種方法是極端地功率低效的。低效發生的原因是沒有確定在不影響系統效能的情況下是否可以用較少的SIMD來執行操作。因此,傳統的系統保持著色器引擎內的所有的SIMD是活動的,無論它們是否需要執行操作。如上所述,當SMD被啟用時,它們消耗功率。即使處于閑置狀態,SIMD仍然消耗最小的、但量可測量的功率。因此,保持所有可用的SIMD啟用,即使未使用的或未被充分利用,也浪費功率。能夠將工作負荷壓縮在盡可能最小數目的SIMD中也將是有利的。這種方法由于給每一個可用的SMD提供工作負荷而可以減少不必要的開銷(overhead)。此外,在傳統的方法中,在著色器復合器(shader complex)中的所有SMD單元的時鐘或同時啟用或同時禁用。在許多應用中,并不是所有的SIMD都被分配工作的。然而,傳統的方法持續主動地提供時鐘信號給這些SMD。該方法會增加圖形處理器的功率消耗,并且是低效的。因此,需要能夠實現SMD的動態控制并在SMD可能不執行處理任務時減少圖形處理器的功率消耗的系統和方法。
技術實現思路
本專利技術的實施方式通過動態地激活和停用在包括多個SIMD的著色器復合器中的單個的SMD而實現在圖形處理單元中節約功率。單個的SMD的動態即時禁用和啟用在實現給定的處理應用所需的效能和功率水平方面提供了靈活性。以這種方式,可以實現圖形處理單元的最佳使用。更具體地,本專利技術的實施方式提供一種每瓦負荷均衡技術(LBPW)。在一個實施中,這種LBPW技術監控算術邏輯單元(ALU)指令的數目并提取每個SMD內執行的指令。此外,新分配的線程負荷(即波陣面)進行排隊并被監控。這種監控用于評估SIMD的當前和未來的利用。根據該方案,著色器引擎中只有實際需要或預期將處理給定工作負荷的SMD保持激活狀態。不需要的SMD被停用。通過停用不需要的SMD,降低功率消耗。作為額外的益處,本專利技術的實施方式在不顯著影響系統性能的情況下提高效能/瓦(performance perwatt)。在本專利技術的又一個實施方式中,減少圖形芯片的di/dt,以提高可靠性和在較低的電壓下提高頻率。這種減少影響材料賬單,并允許使用較便宜的元件。本專利技術的實施方式還實現在著色器復合器中的SMD的動態紋理(grain)(例如中等紋理)時鐘門控。通過按需提供時鐘機制以關閉未使用的邏輯時鐘樹,從而減少開關功率(switching power)。在這種方式中,時鐘門控被增強,從而在SIMD是空閑(或者沒有分配工作)的時間階段節約更多的開關功率。本專利技術的實施方式可以用于任何計算機系統(例如,傳統的計算機(臺式機,筆記本等)系統、計算設備、娛樂系統、媒體系統、游戲系統、通信裝置、個人數字助理),或任何使用一個或多個處理器的系統。由于開發的用于一種類型的處理器的代碼用很少或不用額外的努力可以在另一種類型的處理器中有效利用,因而本專利技術的實施方式可用于例如具有多核的CPU、GPU、和/或GPGPU的處理系統。例如,所開發的用于在GPU執行的代碼,也稱為GPU內核,使用本專利技術的實施方式可被配置在CPU執行。附圖說明被并入說明書中并構成本說明書的一部分的附解了本專利技術的實施方式,并連同上面給出的總體描述和下面給出的實施方式的詳細描述用于解釋本專利技術的原理。在附圖中圖1A示出根據實施方式所述的著色器復合器。圖1B-1D示出根據實施方式所述的可以被配置為控制SMD的寄存器。圖2示出根據實施方式所述的示例性時序圖。圖3A-3B示出根據實施方式所述的用于啟用和禁用SMD的示例性的寄存器設置。圖3C是根據實施方式所述的示例性的操作流程圖。圖4A-4F示出根據實施方式所述的示例性的效能圖表。圖5A是沒有均衡化的傳統的SMD負荷行為的示意圖。圖5B是根據本專利技術的實施方式所述的SIMD負荷行為的示意圖。圖6是根據本專利技術的實施方式所述的示例性的用于評估SMD活動性的可編程查找表的不意圖。圖7是根據本專利技術的實施方式所述的用于執行SIMD負荷均衡化的示例性方法的示例性流程圖。圖8是用于進行圖7所示的先入先出(FIFO)采樣的更詳細的流程圖。圖9是圖7所示的方法步驟的更詳細的流程圖。圖10示出根據本專利技術的實施方式所述的用于動態紋理時鐘門控的示例性的系統。具體實施例方式如上所討論的,本專利技術的實施方式通過動態地激活和停用著色器復合器中單個的SIMD實現功率節約。對圖形處理單元的下降的效能需要或為了降低散熱設計功率(TDP),實施方式動態地禁用SMD。此外,實施方式啟用已禁用的SMD用于高效能應用而無需刷新圖形處理單元的圖形管道。這在不刷新SP的情況下通過動態開關若干SMD而實現。在某種程度上通過適當地編程設計成組的寄存器實現動態控制(或開關)。在實施方式中,著色器管內插器(SPI)根據被配置為動態地指示哪些SMD被激活的寄存器分配新的工作(或線程)。在一個實施方式中,在當前未完成的請求(或掛起的請求)由被禁用的SMD提供服務之后,這種動態配置生效。一旦被禁用,沒有新的來自SPI的請求會通過禁用的SIMD,且可捕獲邏輯(harvestable logic)的時鐘(如,sp4_vsp和紋理時鐘)關閉,以降低圖形處理單元的TDP。當禁用的SMD啟用時,SPI將再次開始分配工作給啟用的SMD,提供圖形處理單元更高的效能。在一個實施方式中,這些SMD和一些要被激活和/停用的SMD的激活和停用依賴于各種因素,如操作條件(例如,溫度、電流、CAC),應用(例如,節約能源的可變的利用)、工作負荷、或其他需求(如,效能需求,功率需求)。SIMD的動態控制圖1A示出示例性的著色器復合器100,其中本專利技術的實施方式得到本文檔來自技高網...
【技術保護點】
【技術特征摘要】
【國外來華專利技術】2010.07.13 US 61/363,856;2010.07.20 US 12/839,9621.一種在計算系統中提高效能的方法,其包括:確定處理應用所需的功率水平;以及根據所述功率水平動態地啟用和禁用在著色器復合器中的一個或多個單指令多數據單元(SMD)。2.如權利要求1所述的方法,還包括:實時地配置多個寄存器以指示何時所述SIMD要被啟用和禁用。3.如權利要求1所述的方法,還包括:確定所述處理應用所需的SMD的數量。4.如權利要求2所述的方法,還包括:審查所配置的所述寄存器;以及根據所述寄存器的配置分配工作線程。5.如權利要求2所述的方法,還包括:在所述配置之前服務一個或多個掛起的工作請求。6.如權利要求1所述的方法,其中,所述動態地啟用和禁用包括在所述SMD的活動執行期間并且獨立于與所述SMD相關的著色器引擎中的活動性啟用和禁用所述SMD。7.如權利要求2所述的方法,還包括:對一個或多個要被禁用的SIMD禁用工作線程;以及確定在所述要被禁用的SIMD中所有掛起的工作線程何時被清空。8.如權利要求1所述的方法,其中,所述啟用和禁用依賴于處理的工作負荷、應用請求和操作條件中的一個或多個。9.如權利要求1所述的方法,進一步包括提供動態中等紋理時鐘門控到所述SMD。10.如權利要求9所述的方法,進一步包括禁用時鐘樹到所述SIMD中的未使用的邏輯。11.如權利要求1所述的方法,進一步包括按需提供計時到所述SIMD。12.—種在計算系統中提高效能的系統,其包括:第一模塊,其被配置為確定處理應用的功率水平;以及第二模塊,其被配置為根據所述功率水平動態地啟用和禁用在著色器復合器中的一個或多個單指令多數據單元(SMD)。13.如權利要求12所述的系統,其中,所述第二模塊實時地配置多個寄存器來指示何時所述SMD要被啟用和禁用。14.如權利要求13所述的系統,其中,所述第二模塊被進一步配置為:審查所配置的所述寄存器;以及根據所述寄存器的配置分配工作線程。15.如權利要求13所述的系統,其中,所述第二模塊在所述配置之前服務一個或多個掛起的工作請求。16.如權利要求12所述的系統,其中,所述第二模塊進一步被配置為在所述SMD的活動執行...
【專利技術屬性】
技術研發人員:圖沙爾·K·沙阿,拉沙德·奧雷費基,邁克爾·J·曼特,布萊恩·恩貝林,
申請(專利權)人:超威半導體公司,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。