System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲熟妇无码AV不卡在线播放,内射无码午夜多人,亚洲国产成人无码AV在线
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    利用3D-DRAM小芯片服務大型語言模型制造技術

    技術編號:44343841 閱讀:17 留言:0更新日期:2025-02-18 20:57
    本文的所公開系統和方法使用多個計算?存儲器小芯片來提供高帶寬處理。一種計算封裝可被配置有多個所述計算?存儲器小芯片,以便執行與大型語言模型相關的處理操作。所述計算?存儲器小芯片可被配置為使用可針對具有低算術強度的工作負載高效地操作的小型低功率計算管芯來操作。

    【技術實現步驟摘要】
    【國外來華專利技術】


    技術介紹

    1、可使用具有多個高帶寬存儲器(“hbm”)管芯的計算封裝來執行高性能計算。然而,這些封裝已經被配置為通過使用高功率計算管芯來操作涉及高算術強度的應用。然而,當前封裝的高算術強度和高功率設計使得它們并不適合用作大型語言模型的機器學習加速器。


    技術實現思路

    1、需要的是一種高帶寬存儲器封裝設計,所述高帶寬存儲器封裝設計被配置為作為用于具有較低算術強度的應用的機器學習加速器高效地操作,諸如以用于服務大型語言模型(llm)或受存儲器帶寬限制的其他模型。本公開的各方面涉及一種機器學習加速器,所述機器學習加速器具有利用多個小芯片實現以增加帶寬的3d存儲器管芯。所述機器學習加速器進一步針對低算術強度被設計來降低封裝的操作所需的功率。此外,本公開的各方面允許所述機器學習加速器在以下封裝上操作,所述封裝在熱約束方面以及在可用于計算和存儲器組件的空間量方面受到限制。

    2、根據本公開的各方面,一種計算封裝可包括:封裝襯底;以及一個或多個計算集群,所述一個或多個計算集群位于所述封裝襯底上;其中所述一個或多個計算集群中的每一個包括與輸入-輸出管芯通信的多個計算-存儲器堆棧;其中每個計算-存儲器堆棧可包括與低功率計算管芯一起堆疊的多個存儲器管芯;并且其中所述輸入-輸出管芯可被配置為通過一個或多個外圍組件互連來傳輸所述多個計算-存儲器堆棧的數據。

    3、在本公開的其他方面,所述多個計算-存儲器堆棧的每個低功率計算管芯可被配置為在約40w或更低的供電電源下操作。

    4、在再一些其他方面,對于所述多個計算-存儲器堆棧中的特定計算-存儲器堆棧,所述低功率計算管芯在所述封裝襯底上的占有面積比所述多個存儲器管芯的占有面積大不到30%。

    5、在本公開的又一些其他方面,所述計算封裝還可包括:多個計算集群,所述多個計算集群位于所述封裝襯底上,并且其中每個計算集群的所述輸入-輸出管芯連接到位于所述封裝襯底上的其他計算集群的一個或多個輸入-輸出管芯。

    6、在本公開的再一些其他方面,所述封裝襯底可包括四個計算集群,并且其中每個計算集群包含四個或更多個計算-存儲器堆棧。此外,每個計算集群可包含至少一個非活動備用計算-存儲器堆棧。

    7、在本公開的其他方面,所述封裝襯底可包括兩個計算集群,并且其中每個計算集群包含八個或更多個計算-存儲器堆棧。此外,每個計算集群可包含至少一個非活動備用計算-存儲器堆棧。

    8、在本公開的又一些其他方面,所述多個計算-存儲器堆棧是堆疊的3d-dram小芯片,并且所述計算封裝被配置為作為大型模型處理單元來操作。

    9、在本公開的再一些其他方面,所述輸入-輸出管芯可被進一步配置為與外部dram或外部遠程直接存儲器訪問(rdma)中的至少一者通信,以與其他計算封裝互連。

    10、在本公開的其他方面,一種計算方法可包括:在位于封裝襯底上的一個或多個計算集群處接收處理命令;使用與輸入-輸出管芯通信的多個計算-存儲器堆棧基于所述處理命令來執行計算操作,其中每個計算-存儲器堆棧包括與低功率計算管芯一起堆疊的多個存儲器管芯;以及通過一個或多個外圍組件互連傳輸來自所述輸入-輸出管芯的數據。

    11、在本公開的再一方面,所述多個計算-存儲器堆棧的每個低功率計算管芯可被配置為在約40w或更低的電源下操作。

    12、在本公開的又一些其他方面,對于所述多個計算-存儲器堆棧中的特定計算-存儲器堆棧,所述低功率計算管芯在所述封裝襯底上的占有面積可比所述多個存儲器管芯的占有面積大不到30%。

    13、在本公開的再一些其他方面,執行所述計算操作還可包括:使用位于所述封裝襯底上的多個計算集群來執行所述計算操作,并且其中每個計算集群的所述輸入-輸出管芯連接到位于所述封裝襯底上的其他計算集群的一個或多個輸入-輸出管芯。

    14、在本公開的其他方面,所述輸入-輸出管芯可被進一步配置為與外部dram或外部遠程直接存儲器訪問(rdma)中的至少一者通信,以與其他計算封裝互連。

    15、根據本公開的再一些其他方面,一種大型模型處理單元可包括通過外圍組件互連連接的一個或多個計算封裝,并且每個計算封裝可包括:封裝襯底;以及一個或多個計算集群,所述一個或多個計算集群位于所述封裝襯底上;其中所述一個或多個計算集群中的每一個包括與輸入-輸出管芯通信的多個計算-存儲器堆棧;其中每個計算-存儲器堆棧包括與低功率計算管芯一起堆疊的多個存儲器管芯;并且其中所述輸入-輸出管芯被配置為通過所述一個或多個外圍組件互連來傳輸所述多個計算-存儲器堆棧的數據。

    本文檔來自技高網...

    【技術保護點】

    1.一種計算封裝,其特征在于,包括:

    2.如權利要求1所述的計算封裝,其特征在于,所述多個計算-存儲器堆棧的每個低功率計算管芯被配置為在約40W或更低的電源下操作。

    3.如權利要求1所述的計算封裝,其特征在于,對于所述多個計算-存儲器堆棧中的特定計算-存儲器堆棧,所述低功率計算管芯在所述封裝襯底上的占有面積比所述多個存儲器管芯的占有面積大不到30%。

    4.如權利要求1所述的計算封裝,其特征在于,還包括:位于所述封裝襯底上的多個計算集群,并且其中每個計算集群的所述輸入-輸出管芯連接到位于所述封裝襯底上的其他計算集群的一個或多個輸入-輸出管芯。

    5.如權利要求4所述的計算封裝,其特征在于,所述封裝襯底包括四個計算集群,并且其中每個計算集群包含四個或更多個計算-存儲器堆棧。

    6.如權利要求4所述的計算封裝,其特征在于,所述封裝襯底包括兩個計算集群,并且其中每個計算集群包含八個或更多個計算-存儲器堆棧。

    7.如權利要求1所述的計算封裝,其特征在于,每個計算集群包含至少一個非活動備用計算-存儲器堆棧。

    8.如權利要求1所述的計算封裝,其特征在于,所述多個計算-存儲器堆棧是堆疊的3D-DRAM小芯片。

    9.如權利要求1所述的計算封裝,其特征在于,所述計算封裝被配置為作為大型模型處理單元來操作。

    10.如權利要求1所述的計算封裝,其特征在于,所述輸入-輸出管芯被進一步配置為與外部DRAM或外部遠程直接存儲器訪問(RDMA)中的至少一者通信,以與其他計算封裝互連。

    11.一種計算的方法,其特征在于,包括:

    12.如權利要求11所述的方法,其特征在于,所述多個計算-存儲器堆棧的每個低功率計算管芯被配置為在約40W或更低的電源下操作。

    13.如權利要求11所述的方法,其特征在于,對于所述多個計算-存儲器堆棧中的特定計算-存儲器堆棧,所述低功率計算管芯在所述封裝襯底上的占有面積比所述多個存儲器管芯的占有面積大不到30%。

    14.如權利要求11所述的方法,其特征在于,執行所述計算操作還包括:使用位于所述封裝襯底上的多個計算集群來執行所述計算操作,并且其中每個計算集群的所述輸入-輸出管芯連接到位于所述封裝襯底上的其他計算集群的一個或多個輸入-輸出管芯。

    15.如權利要求14所述的方法,其特征在于,所述封裝襯底包括四個計算集群,并且其中每個計算集群包含四個或更多個活動計算-存儲器堆棧。

    16.如權利要求14所述的方法,其特征在于,所述封裝襯底包括兩個計算集群,并且其中每個計算集群包含八個或更多個活動計算-存儲器堆棧。

    17.如權利要求11所述的方法,其特征在于,每個計算集群包含至少一個非活動備用計算-存儲器堆棧。

    18.如權利要求11所述的方法,其特征在于,所述多個計算-存儲器堆棧是堆疊的3D-DRAM小芯片。

    19.如權利要求11所述的方法,其特征在于,所述輸入-輸出管芯被進一步配置為與外部DRAM或外部遠程直接存儲器訪問(RDMA)中的至少一者通信,以與其他計算封裝互連。

    20.一種大型模型處理單元,其特征在于,包括:一個或多個計算封裝,所述一個或多個計算封裝通過外圍組件互連而連接,每個計算封裝包括:

    ...

    【技術特征摘要】
    【國外來華專利技術】

    1.一種計算封裝,其特征在于,包括:

    2.如權利要求1所述的計算封裝,其特征在于,所述多個計算-存儲器堆棧的每個低功率計算管芯被配置為在約40w或更低的電源下操作。

    3.如權利要求1所述的計算封裝,其特征在于,對于所述多個計算-存儲器堆棧中的特定計算-存儲器堆棧,所述低功率計算管芯在所述封裝襯底上的占有面積比所述多個存儲器管芯的占有面積大不到30%。

    4.如權利要求1所述的計算封裝,其特征在于,還包括:位于所述封裝襯底上的多個計算集群,并且其中每個計算集群的所述輸入-輸出管芯連接到位于所述封裝襯底上的其他計算集群的一個或多個輸入-輸出管芯。

    5.如權利要求4所述的計算封裝,其特征在于,所述封裝襯底包括四個計算集群,并且其中每個計算集群包含四個或更多個計算-存儲器堆棧。

    6.如權利要求4所述的計算封裝,其特征在于,所述封裝襯底包括兩個計算集群,并且其中每個計算集群包含八個或更多個計算-存儲器堆棧。

    7.如權利要求1所述的計算封裝,其特征在于,每個計算集群包含至少一個非活動備用計算-存儲器堆棧。

    8.如權利要求1所述的計算封裝,其特征在于,所述多個計算-存儲器堆棧是堆疊的3d-dram小芯片。

    9.如權利要求1所述的計算封裝,其特征在于,所述計算封裝被配置為作為大型模型處理單元來操作。

    10.如權利要求1所述的計算封裝,其特征在于,所述輸入-輸出管芯被進一步配置為與外部dram或外部遠程直接存儲器訪問(rdma)中的至少一者通信,以與其他計算封裝互連。

    11.一種計算的方法,其特征在于,包...

    【專利技術屬性】
    技術研發人員:馬嘯宇大衛·帕特森
    申請(專利權)人:谷歌有限責任公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 一本大道无码日韩精品影视 | 久久久久亚洲AV无码专区体验| 国产免费AV片无码永久免费 | 中文有码vs无码人妻| 亚洲精品无码成人片久久| 在线观看无码不卡AV| 无码人妻丰满熟妇区毛片18| 久久综合精品国产二区无码| 亚洲AV无码乱码在线观看性色扶| 亚洲中文字幕久久精品无码2021| 潮喷失禁大喷水aⅴ无码| 无码专区永久免费AV网站| 国产乱人伦Av在线无码| 精品人体无码一区二区三区| 亚洲AV无码国产精品永久一区| 无码专区—VA亚洲V天堂| 久久亚洲国产成人精品无码区| 国产丰满乱子伦无码专| 亚洲AV综合色区无码二区偷拍| 久久无码av三级| 免费无码又爽又刺激高潮软件 | 无码国内精品久久人妻麻豆按摩 | 国产精品无码免费播放| 亚洲av无码电影网| 亚洲AV区无码字幕中文色| 成年午夜无码av片在线观看| 成人无码嫩草影院| 国产AV无码专区亚洲AV麻豆丫| 影音先锋中文无码一区 | 日韩精品无码一区二区三区免费| 人妻无码中文字幕| 午夜无码一区二区三区在线观看| 日韩精品成人无码专区免费 | 日韩av片无码一区二区不卡电影| 亚洲色av性色在线观无码| 亚洲AV日韩AV高潮无码专区| 无码精品久久久天天影视| 无码精品人妻一区二区三区人妻斩| 无码精品日韩中文字幕| 亚洲中文无码线在线观看| 亚洲综合无码无在线观看|