System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及通信和計算領域,具體涉及一種計算系統以及用于該計算系統的光模塊。
技術介紹
1、隨著ai加速器通過各種工藝迭代和芯片架構的創新獲得持續的計算能力提升,ai加速器之間的互連帶寬也在不斷增長。人工智能研究公司openai的數據顯示,目前,人工智能模型計算量增長的速度已經遠超計算硬件計算能力增長的速度。
2、ai加速器互連網絡已成為提升整體算力的關鍵。在傳統的互連網絡中通常采用電通道對各個加速器進行互連,然而電通道的響應會隨著信號速率的提升而衰減,更高速率的接口往往會涉及到更復雜的架構和電路設計,引入延遲的代價,并且消耗更多的功率和占用更大的芯片面積,從而限制芯片i/o帶寬。另外,更長的金屬布線距離也會進一步惡化電路的損耗特性,限制ai加速器之間的互連距離。為了打破長距離高頻電學鏈路損耗的限制,近年來,在計算系統中采用光備受青睞。與電互連相比,光通道的損耗在不同頻率下保持不變,并且數值非常小,因而光互連可以支持更長的傳輸距離。
3、此外,當計算模型擴展到更多節點時,由于節點間更高的延遲和更低的鏈路帶寬,節點間通信會發生阻塞,這導致計算資源利用不足。鑒于此,將原本ai加速器對外通信的接口替換成光互連接口可以大大增加互連距離。與電學互連相比,光學互連不僅可以利用光纖極低損耗的性質來擴展距離,也提供了布線的靈活性。例如,針對大帶寬全連接拓撲結構的密集網絡,如果使用電互連網絡,由于有限的金屬層的限制,電信號不能以最大的帶寬密度進行多交叉的復雜互連,利用基板和pcb板的平面內電線布線具有很大的挑戰。但是對于光互
4、然而,隨著計算系統對光互連帶寬的需求不斷增長,光纖數量也會隨之成倍增長,這容易導致連纖變得混亂不堪,無法通過手工方式進行有效梳理,極易出錯,且錯連時排查困難,增加了大量的運維成本,這對光互連計算系統的維護管理來說無疑是一個全新的挑戰。
技術實現思路
1、為了解決以上問題,本公開提出了把復雜的光互連網絡集成在一塊光背板中。例如,光背板可以固化光互連網絡內部的所有光通道,從而有利于節省紛繁復雜的連纖工作。同時,通過把光背板做薄做小,并且將其與計算裝置集成在一個計算系統中,有利于提升集成度,同時實現各個計算裝置之間的光互連。
2、本公開一方面提供了一種計算系統,包括:光背板,包括多個光連接器以及由布置在所述多個光連接器的兩兩之間的光鏈路形成的網絡;以及多個計算裝置,每個計算裝置包括連接至所述多個光連接器之一的光接口。所述多個計算裝置中的每兩個計算裝置之間通過所述網絡中的對應光鏈路進行點對點的光互連。
3、在一些實施例中,所述光背板包括載板,并且所述網絡包括布置在所述載板中并且在所述多個光連接器的兩兩之間的多個光纖通路。
4、在一些實施例中,所述光背板包括光波導板,并且所述網絡包括布置在所述光波導板內并且在所述多個光連接器的兩兩之間的多個光波導通路。
5、在一些實施例中,所述每個計算裝置的光接口包括多個光輸入端口和多個光輸出端口,并且其中所述多個計算裝置中的每兩個計算裝置之間的所述對應光鏈路通過對應的光連接器連接至所述多個光輸入端口中的對應光輸入端口和所述多個光輸出端口中的對應光輸出端口。
6、在一些實施例中,所述每個計算裝置包括:pcb板;計算芯片,布置在所述pcb板上,所述計算芯片包括一個或多個輸入輸出高速接口,其中每個輸入輸出高速接口具有一個或多個輸入高速端口以及一個或多個輸出高速端口,所述每個輸出高速端口對所述計算芯片內的并行信號進行并串轉換以輸出第一電信號,并且每個輸入高速端口對接收到的作為高速串行信號的第二電信號進行串并轉換;以及一個或多個光模塊,布置在所述pcb板上,每個光模塊包括電輸入輸出接口和光輸入輸出接口,所述電輸入輸出接口包括至少一個電輸入端口和至少一個電輸出端口,所述光輸入輸出接口包括至少一個光輸入端口以及至少一個光輸出端口,其中所述至少一個電輸入端口中的每個分別與所述一個或多個輸出高速端口中的對應一個通過所述pcb板中的布線電連接,所述至少一個電輸出端口中的每個分別與所述一個或多個輸入高速端口中的對應一個通過所述pcb板中的布線電連接,所述每個光模塊將從所述至少一個電輸入端口中的每個接收的所述第一電信號轉換為從所述至少一個光輸出端口中的一個輸出的第一光信號,并且將從所述至少一個光輸入端口中的每個接收的第二光信號轉換為所述第二電信號并輸出所述第二電信號,并且其中,所述一個或多個光模塊的各個光輸入輸出接口共同構成所述每個計算裝置的所述光接口。
7、在一些實施例中,所述多個計算裝置中的第一計算裝置和第二計算裝置之間如下進行數據傳輸:由所述第一計算裝置中的計算芯片的對應輸出高速端口輸出的所述第一電信號被提供給所述第一計算裝置中的對應光模塊的對應電輸入端口;所述對應光模塊將所述第一電信號轉換為所述第一光信號并且從對應光輸出端口輸出;所述第一光信號經由所述光背板中的對應光鏈路被提供給所述第二裝置的對應光模塊的對應光輸入端口;以及所述第二裝置的所述對應光模塊將所述第一光信號轉換為對應的電信號并提供給所述第二裝置的計算芯片。
8、在一些實施例中,所述第一計算裝置和所述第二計算裝置是相同的計算裝置或不同的計算裝置。
9、在一些實施例中,所述計算芯片的輸出高速端口的數量等于所述一個或多個光模塊的電輸入端口的總數,并且所述計算芯片的輸入高速端口的數量等于所述一個或多個光模塊的電輸出端口的總數。
10、在一些實施例中,所述每個計算裝置還包括至少一個高帶寬內存(hbm)單元,所述至少一個hbm單元與所述計算芯片被封裝在基板上,并且所述基板被布置在所述pcb板上。
11、在一些實施例中,所述至少一個hbm單元與所述計算芯片通過中介層被封裝在所述基板上。
本文檔來自技高網...【技術保護點】
1.一種計算系統,包括:
2.如權利要求1所述的計算系統,其中,所述光背板包括載板,并且所述網絡包括布置在所述載板中并且在所述多個光連接器的兩兩之間的多個光纖通路。
3.如權利要求1所述的計算系統,其中,所述光背板包括光波導板,并且所述網絡包括布置在所述光波導板內并且在所述多個光連接器的兩兩之間的多個光波導通路。
4.如權利要求1所述的計算系統,其中,所述每個計算裝置的光接口包括多個光輸入端口和多個光輸出端口,并且
5.如權利要求1至4中任一項所述的計算系統,其中,所述每個計算裝置包括:
6.如權利要求5所述的計算系統,其中,所述多個計算裝置中的第一計算裝置和第二計算裝置之間如下進行數據傳輸:
7.如權利要求6所述的計算系統,其中,所述第一計算裝置和所述第二計算裝置是相同的計算裝置或不同的計算裝置。
8.如權利要求5所述的計算系統,其中,所述計算芯片的輸出高速端口的數量等于所述一個或多個光模塊的電輸入端口的總數,并且所述計算芯片的輸入高速端口的數量等于所述一個或多個光模塊的電輸出端口的總數。
>9.如權利要求5所述的計算系統,其中,所述每個計算裝置還包括至少一個高帶寬內存(HBM)單元,所述至少一個HBM單元與所述計算芯片被封裝在基板上,并且所述基板被布置在所述PCB板上。
10.如權利要求9所述的計算系統,其中,所述至少一個HBM單元與所述計算芯片通過中介層被封裝在所述基板上。
...【技術特征摘要】
1.一種計算系統,包括:
2.如權利要求1所述的計算系統,其中,所述光背板包括載板,并且所述網絡包括布置在所述載板中并且在所述多個光連接器的兩兩之間的多個光纖通路。
3.如權利要求1所述的計算系統,其中,所述光背板包括光波導板,并且所述網絡包括布置在所述光波導板內并且在所述多個光連接器的兩兩之間的多個光波導通路。
4.如權利要求1所述的計算系統,其中,所述每個計算裝置的光接口包括多個光輸入端口和多個光輸出端口,并且
5.如權利要求1至4中任一項所述的計算系統,其中,所述每個計算裝置包括:
6.如權利要求5所述的計算系統,其中,所述多個計算裝置中的第一計算裝置和第二計算裝置之間如下進行數...
【專利技術屬性】
技術研發人員:沈亦晨,孟懷宇,徐葉龍,朱劍,于山山,
申請(專利權)人:上海曦智科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。