當前位置: 首頁 > 專利查詢>中國人民解放軍軍事科學院國防科技創新研究院專利>正文

一種用于MCM-GPU的虛實地址轉換查找方法技術

技術編號：44452655 閱讀：4 留言：0更新日期：2025-02-28 18:57

本發明專利技術技術方案提供了一種用于MCM?GPU的虛實地址轉換查找方法，包括：GPU內各CU均對應有各自的輪轉仲裁器，所述輪轉仲裁器在時鐘周期內接收虛實地址轉換請求，根據所述虛實地址轉換請求的類型在同一GPU內的CU中進行虛實地址轉換，或，找尋其他GUP的L2?TLB進行虛實地址轉換。優點是提供的一種TLB探測機制能夠在本地L1?TLB失效時，訪問同一GPU內臨近CU的私有L1?TLB看是否有虛實地址轉換命中，如果有命中，則返回真實內存頁號。如果臨近CU的私有L1?TLB均沒有命中，則將該虛實地址轉換請求發往片間互連網絡，通過片間互連網絡訪問相應的共享L2?TLB。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及虛實地址轉換領域，尤其涉及一種用于mcm-gpu的虛實地址轉換查找方法。

技術介紹

1、多芯片模塊?gpu（mcm-gpu）作為一種分離式設計，通過在單一封裝內集成多個gpu模塊（gpu?modules,?gpm），每個芯粒僅包含傳統單片系統級芯片?(soc)?中的部分資源,以此實現性能的持續擴展。

2、隨著mcm-gpu在并行計算和高性能計算領域的廣泛應用，如何有效地管理虛擬內存已成為管理?gpu?存儲空間的關鍵。傳統的內存訪問中，當?l1?tl未命中時，虛擬地址需通過片間互連網絡去訪問遠端的l2?tlb，造成較大的地址轉換延遲。

3、現有技術中mcm-gpu系統中的虛擬內存管理架構由多個gpu芯片和一個cpu組成，通過cpu中的iommu（輸入輸出內存管理單元）協同管理虛擬到物理地址的轉換。在每個gpu芯片內部，包含多個計算單元（cu），每個cu都連接到私有的l1?tlb。l1?tlb用于緩存最近使用的虛擬到物理地址映射，當cu需要訪問內存時，l1?tlb可以直接提供物理地址，從而減少訪問延遲。當l1?tlb未能命中時，系統會根據虛擬地址在全局共享的l2?tlb中進行查找。l2tlb由多個gpu芯片共享，因此請求可以被路由至存有相關映射的特定gpu進行轉換操作，進一步提高了地址轉換的命中率和系統的資源利用率。在地址轉換未能在?gpu?內的?tlb中命中時，虛擬地址請求會被發送到?cpu?中的?iommu。iommu?包含多個頁表遍歷器（pagetable?walker），可以從內存中逐級

4、mcm-gpu中若其中一個gpu模塊中的某個cu發生?l1?tlb失效，由于l2?tlb是共享的，那么該l1?tlb失效的虛實地址轉換請求會根據相應的地址映射算法發往某個gpu模塊的l2?tlb。與單gpu相比，mcm-gpu中的片間互連網絡延遲更高，帶寬受限，因此訪問遠端l2tlb的請求具有極高的延遲，會顯著影響?mcm-gpu?的整體性能，使得系統運算顯著減緩。

5、為了解決上述問題，現有技術mcm-gpu對其中每個gpu設置各自對應的l2?tlb，與多個gpu共享的l2?tlb相比，每個gpu私有l2?tlb在性能、訪問延遲和資源利用上均表現出不同的優勢和限制。每個gpu在訪問自己的l2?tlb時不需跨芯片請求，直接訪問本地l2?tlb能顯著降低訪問延遲，這對需要頻繁虛擬地址轉換的應用尤其有利。但，由于各gpu的l2tlb各自獨立工作，不可避免的會出現不同gpu的l2?tlb多次存儲同一虛擬地址映射的情況，導致內存資源的浪費，特別是在高頻跨gpu數據共享的場景中，這種重復存儲的開銷尤為明顯。此外，私有l2?tlb缺乏集中管理能力，不同gpu之間無法共享地址轉換結果，進而在不同gpu之間的數據交互和協同處理過程中，私有l2?tlb的利用效率較低，反而會增加iommu的負載，造成整體系統的虛實地址轉換效率降低。相比之下，前述多個gpu共享的l2tlb能有效優化資源利用，通過共享機制集中存儲和管理虛擬地址映射表，避免了同一地址在多個l2?tlb中的重復存儲和更新操作，顯著提高了資源利用率。這種集中管理方式還具備跨gpu訪問的便利性，能夠提高l2?tlb的整體命中率，降低每次l1tlb未命中的訪問次數，并減少iommu的負擔，從而提升整個系統的虛擬內存管理效率。

6、這兩種方式有各自的優缺點，第一種方法能充分利用資源但易導致訪問延遲，第二種方法轉換效率低易造成資源浪費但訪問快速。

7、所以，如何能夠提供一種不僅資源利用率高還能夠快速轉換虛實地址效率的虛實地址轉換查找方法成為亟待解決的問題。

技術實現思路

1、本專利技術提供一種用于mcm-gpu的虛實地址轉換查找方法，用以解決現有技術中mcm-gpu能夠快速進行虛實地址轉換的同時降低資源浪費的問題。

2、為了實現上述目的，本專利技術技術方案提供了一種用于mcm-gpu的虛實地址轉換查找方法，包括：gpu內各cu均對應有各自的輪轉仲裁器，所述輪轉仲裁器在時鐘周期內接收虛實地址轉換請求，根據所述虛實地址轉換請求的類型在同一gpu內的cu中進行虛實地址轉換，或，找尋其他gup的l2?tlb進行虛實地址轉換。

3、作為上述技術方案的優選，較佳的，所述輪轉仲裁器同時接收交叉開關和加載存儲單元同時發送的不同類型的虛實地址轉換請求，根據時鐘周期將相應所述虛實地址轉換請求發送至其對應cu的l1?tlb。

4、作為上述技術方案的優選，較佳的，所述輪轉仲裁器在時鐘周期內接收虛實地址轉換請求，包括：所述輪轉仲裁器在時鐘周期內同時接收其對應的加載儲存單元發送的本地虛實地址轉換請求和所述gpu內交叉開關發送的來自其他cu的遠端虛實地址轉換請求。

5、作為上述技術方案的優選，較佳的，時鐘周期包括本地時鐘周期和遠端時鐘周期，兩時鐘周期交替輪轉；若當前周期為本地時鐘周期，則優先處理所述加載儲存單元發送的所述本地虛實地址轉換請求；若當前周期為遠端時鐘周期，則優先處理所述交叉開關發送的來自本gpu內其他cu的所述遠端虛實地址轉換請求。

6、作為上述技術方案的優選，較佳的，當cu中l1?tlb接收到的請求為所述本地虛實地址轉換請求時：若請求成功，則所述本地虛實地址轉換請求返回所述加載儲存單元進行訪存操作；若請求失效，則查詢空閑cu，將所述本地虛實請求轉發至所述空閑cu的所述輪轉仲裁器進行請求。

7、作為上述技術方案的優選，較佳的，查詢空閑cu，將所述本地虛實請求轉發至所述空閑cu的所述輪轉仲裁器進行請求，包括，訪問失敗的所述l1?tlb將此本地虛實地址轉換請求轉發至當前gpu內的交叉網絡開關；路由仲裁器查詢所述當前gpu內的空閑cu，若查詢到，則將所述本地虛實地址轉換請求發送至所述空閑cu。

8、作為上述技術方案的優選，較佳的，當cu中l1?tlb接收到的請求為所述遠端虛實地址轉換請求時：若請求成功，則通過交叉開關反饋請求結果至發起所述遠端虛實地址轉換請求的cu；若請求失敗，則通過所述交叉開關發送所述遠端虛實地址轉換請求至片間互聯網絡，找尋其他gup的l2?tlb進行虛實地址轉換。

9、作為上述技術方案的優選，較佳的，請求成功，指的是，所述交叉網絡開關遍歷當前gpu內所有cu的l1?tlb，直至當前所述遠端虛實地址轉換請求成功。

10、作為上述技術方案的優選，較佳的，請求失敗，指的是：遍歷當前gpu內所有cu的l1tlb后，無l1?tlb能夠接受所述遠端虛實地址轉換請求。

11、本專利技術技術方案提供了一種用于mcm-gpu的虛實地址轉換查找方法，包括：gpu內各cu均對應有各自的輪轉仲裁器，所述輪轉仲裁器在時鐘周期內接收虛實地址轉換請求，根據所述虛實地址轉換請求的類型在同一gpu內的cu中進行虛實地址轉換，或，找尋其他gup的l2?tlb進行虛實地址轉換。

12、本本文檔來自技高網...

【技術保護點】

1.一種用于MCM-GPU的虛實地址轉換查找方法，其特征在于，所述方法包括：

2.根據權利要求1所述的方法，其特征在于，所述輪轉仲裁器同時接收交叉開關和加載存儲單元同時發送的不同類型的虛實地址轉換請求，根據時鐘周期將相應所述虛實地址轉換請求發送至其對應CU的L1?TLB；其中，L1?TLB為Level1?Translation?Lookaside?Buffer一級地址翻譯高速緩沖。

3.根據權利要求1所述的方法，其特征在于，所述輪轉仲裁器在時鐘周期內接收虛實地址轉換請求，包括：

4.根據權利要求3所述的方法，其特征在于，所述時鐘周期包括本地時鐘周期和遠端時鐘周期，兩時鐘周期交替輪轉；

5.根據權利要求3所述的方法，其特征在于，當CU中L1?TLB接收到的請求為所述本地虛實地址轉換請求時：若請求成功，則所述本地虛實地址轉換請求返回所述加載儲存單元進行訪存操作；若請求失效，則查詢空閑CU，將所述本地虛實請求轉發至所述空閑CU的所述輪轉仲裁器進行請求；其中，L1?TLB為Level1?Translation?Lookaside?Buffer一級地址翻譯高速緩沖。

6.根據權利要求5所述的方法，其特征在于，所述查詢空閑CU，將所述本地虛實請求轉發至所述空閑CU的所述輪轉仲裁器進行請求，包括，

7.根據權利要求3所述的方法，其特征在于，當CU中L1?TLB接收到的請求為所述遠端虛實地址轉換請求時：若請求成功，則通過交叉開關反饋請求結果至發起所述遠端虛實地址轉換請求的CU；若請求失敗，則通過所述交叉開關發送所述遠端虛實地址轉換請求至片間互聯網絡，找尋其他GUP的L2?TLB進行虛實地址轉換；其中，L1?TLB為Level1?TranslationLookaside?Buffer一級地址翻譯高速緩沖。

8.根據權利要求7所述的方法，其特征在于，所述請求成功，指的是，所述交叉網絡開關遍歷當前GPU內所有CU的L1?TLB，直至當前所述遠端虛實地址轉換請求成功。

9.根據權利要求7所述的方法，其特征在于，所述請求失敗，指的是：遍歷當前GPU內所有CU的L1?TLB后，無L1?TLB能夠接受所述遠端虛實地址轉換請求。

...

【技術特征摘要】

1.一種用于mcm-gpu的虛實地址轉換查找方法，其特征在于，所述方法包括：

2.根據權利要求1所述的方法，其特征在于，所述輪轉仲裁器同時接收交叉開關和加載存儲單元同時發送的不同類型的虛實地址轉換請求，根據時鐘周期將相應所述虛實地址轉換請求發送至其對應cu的l1?tlb；其中，l1?tlb為level1?translation?lookaside?buffer一級地址翻譯高速緩沖。

3.根據權利要求1所述的方法，其特征在于，所述輪轉仲裁器在時鐘周期內接收虛實地址轉換請求，包括：

4.根據權利要求3所述的方法，其特征在于，所述時鐘周期包括本地時鐘周期和遠端時鐘周期，兩時鐘周期交替輪轉；

5.根據權利要求3所述的方法，其特征在于，當cu中l1?tlb接收到的請求為所述本地虛實地址轉換請求時：若請求成功，則所述本地虛實地址轉換請求返回所述加載儲存單元進行訪存操作；若請求失效，則查詢空閑cu，將所述本地虛實請求轉發至所述空閑cu的所述輪轉仲裁器進行請求；其中，l1?tlb為level1?translation...

【專利技術屬性】
技術研發人員：趙夏，劉洋徐瑞，溫家輝，方健，王璐，裴秉璽，張光達，
申請(專利權)人：中國人民解放軍軍事科學院國防科技創新研究院，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術