System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 日韩精品中文字幕无码一区,精品无码成人片一区二区98 ,人妻无码久久一区二区三区免费
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種加速器、數(shù)據(jù)處理方法及相關(guān)設(shè)備技術(shù)

    技術(shù)編號(hào):44422763 閱讀:2 留言:0更新日期:2025-02-28 18:38
    本申請(qǐng)?zhí)峁┮环N加速器、數(shù)據(jù)處理方法和相關(guān)設(shè)備,其中,該加速器包括通信調(diào)度引擎、通信單元,計(jì)算調(diào)度引擎和計(jì)算單元。通信調(diào)度引擎用于獲取中間表示,然后根據(jù)中間表示調(diào)用通信單元執(zhí)行多個(gè)通信算子中的第一通信算子,并調(diào)用計(jì)算單元執(zhí)行通信任務(wù)中的計(jì)算算子或通知所述計(jì)算調(diào)度引擎使得所述計(jì)算調(diào)度引擎調(diào)度計(jì)算單元執(zhí)行所述通信任務(wù)中的計(jì)算算子。上述中間表示用于表示模型推理任務(wù)或模型訓(xùn)練任務(wù),中間表示包括通信任務(wù),該通信任務(wù)指示執(zhí)行一次集合通信。通過上述加速器實(shí)現(xiàn)上述集合通信,能夠提高各個(gè)加速器的資源利用率,提高分布式計(jì)算的效率。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本申請(qǐng)涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種加速器、數(shù)據(jù)處理方法及相關(guān)設(shè)備


    技術(shù)介紹

    1、隨著高性能計(jì)算(high?performance?computing,hpc)和人工智能(artificialintelligence,ai)技術(shù)的方法的發(fā)展,計(jì)算設(shè)備需要處理的數(shù)據(jù)的規(guī)模也在不斷增大,為例解決大規(guī)模數(shù)據(jù)的計(jì)算問題,分布式計(jì)算應(yīng)運(yùn)而生。當(dāng)前的分布式計(jì)算領(lǐng)域中,分布式計(jì)算將計(jì)算任務(wù)分配給多個(gè)計(jì)算設(shè)備執(zhí)行,在進(jìn)行分布式計(jì)算的過程中,各個(gè)計(jì)算設(shè)備之間會(huì)涉及到數(shù)據(jù)的交互,集合通信在分布式計(jì)算中有著大量且重要的應(yīng)用,例如全局規(guī)約(allreduce)、全局收集(allgather)等集合通信方法是實(shí)現(xiàn)分布式計(jì)算中多個(gè)計(jì)算設(shè)備之間進(jìn)行數(shù)據(jù)交互的常用方法。但是當(dāng)前的集合通信方式存在資源利用率不高的問題。


    技術(shù)實(shí)現(xiàn)思路

    1、本申請(qǐng)?zhí)峁┮环N加速器、數(shù)據(jù)處理方法和相關(guān)設(shè)備,能夠提高加速器的資源利用率,提高分布式計(jì)算的效率。

    2、第一方面,本申請(qǐng)?zhí)峁┮环N加速器,該加速器包括通信調(diào)度引擎、通信單元,計(jì)算調(diào)度引擎和計(jì)算單元。該通信調(diào)度引擎用于獲取模型推理任務(wù)或模型訓(xùn)練任務(wù)對(duì)應(yīng)的中間表示,然后根據(jù)中間表示調(diào)用通信單元執(zhí)行一個(gè)通信任務(wù)所包括的多個(gè)通信算子中的第一通信算子,并調(diào)用計(jì)算單元執(zhí)行該通信任務(wù)中的計(jì)算算子,或者通知計(jì)算調(diào)度引擎使得計(jì)算調(diào)度引擎調(diào)用計(jì)算單元執(zhí)行該通信任務(wù)中的計(jì)算算子。上述中間表示包括上述通信任務(wù),該通信任務(wù)指示執(zhí)行一次集合通信。

    3、用于實(shí)現(xiàn)集合通信的通信任務(wù)中既包括用于實(shí)現(xiàn)發(fā)送/接收數(shù)據(jù)的通信算子,也包括用于計(jì)算的計(jì)算算子,在通過上述加速器執(zhí)行通信任務(wù)的過程中,加速器通過通信調(diào)度引擎調(diào)用通信單元執(zhí)行通信算子時(shí),能夠通過通信調(diào)度引擎或者計(jì)算調(diào)度引擎調(diào)用計(jì)算單元執(zhí)行通信任務(wù)中的計(jì)算算子,實(shí)現(xiàn)加速器在執(zhí)行通信算子發(fā)送數(shù)據(jù)的同時(shí)執(zhí)行計(jì)算算子進(jìn)行數(shù)據(jù)的計(jì)算,從而實(shí)現(xiàn)通信與計(jì)算的并行,避免在執(zhí)行通信算子時(shí)計(jì)算單元處于空閑狀態(tài),能夠提高加速器的資源利用率,從而提高分布式計(jì)算的效率。

    4、在一種可能的實(shí)現(xiàn)方式中,上述中間表示還包括計(jì)算任務(wù),計(jì)算調(diào)度引擎用于根據(jù)中間表示調(diào)用計(jì)算單元執(zhí)行計(jì)算任務(wù)。中間表示用于實(shí)現(xiàn)模型推理任務(wù)或模型訓(xùn)練任務(wù),中間表示所對(duì)應(yīng)的任務(wù)包括計(jì)算任務(wù)和通信任務(wù),計(jì)算任務(wù)通過計(jì)算單元執(zhí)行以生成需要傳輸?shù)臄?shù)據(jù),通信任務(wù)用于對(duì)計(jì)算任務(wù)生成的數(shù)據(jù)進(jìn)行集合通信,實(shí)現(xiàn)不同加速器之間的數(shù)據(jù)的聚合。

    5、在一種可能的實(shí)現(xiàn)方式中,通信調(diào)度引擎,還用于在執(zhí)行完通信任務(wù)的情況下,向計(jì)算調(diào)度引擎發(fā)送通知信息;計(jì)算調(diào)度引擎,還用于在接收到通知信息的情況下,執(zhí)行中間表示中通信任務(wù)之后的計(jì)算任務(wù)。

    6、在一種可能的實(shí)現(xiàn)方式中,上述計(jì)算調(diào)度引擎,還用于在執(zhí)行完計(jì)算任務(wù)的情況下,向通信調(diào)度引擎發(fā)送通知信息;通信調(diào)度引擎,還用于在接收到通知信息的情況下,執(zhí)行中間表示中計(jì)算任務(wù)之后的通信任務(wù)。

    7、通信調(diào)度引擎用于執(zhí)行通信任務(wù),計(jì)算調(diào)度引擎用于執(zhí)行計(jì)算任務(wù),通信調(diào)度引擎和計(jì)算調(diào)度引擎在執(zhí)行完各自對(duì)應(yīng)的任務(wù)后,會(huì)向另一個(gè)調(diào)度引擎發(fā)送通知信息以通知另一個(gè)調(diào)度引擎執(zhí)行對(duì)應(yīng)的任務(wù)。

    8、在一種可能的實(shí)現(xiàn)方式中,上述中間表示中的通信任務(wù)由處理器調(diào)用第一函數(shù)產(chǎn)生,第一函數(shù)的輸入為集合通信標(biāo)識(shí),例如集合通信的名稱。

    9、在一種可能的實(shí)現(xiàn)方式中,上述通信任務(wù)為全局規(guī)約allreduce或全局收集allgather。

    10、在一種可能的實(shí)現(xiàn)方式中,在通信任務(wù)為allreduce的情況下,上述計(jì)算算子包括量化算子和反量化算子;其中,每個(gè)量化算子指示對(duì)加速器中的部分?jǐn)?shù)據(jù)進(jìn)行量化操作。

    11、在一種可能的實(shí)現(xiàn)方式中,在通信任務(wù)為allgather的情況下,上述計(jì)算算子包括矩陣乘算子。

    12、在一種可能的實(shí)現(xiàn)方式中,上述加速器為圖形處理器(graphics?processingunit,gpu)、神經(jīng)網(wǎng)絡(luò)處理器(neural?network?processing?unit,npu)、張量處理器(tensorprocessing?unit,tpu)或?qū)S胊i處理芯片。

    13、第二方面,本申請(qǐng)?zhí)峁┮环N數(shù)據(jù)處理方法,應(yīng)用于計(jì)算設(shè)備,該計(jì)算設(shè)備包括通信調(diào)度引擎、通信單元、計(jì)算調(diào)度引擎和計(jì)算單元,所述方法包括:通信調(diào)度引擎獲取模型推理任務(wù)或模型訓(xùn)練任務(wù)對(duì)應(yīng)的中間表示,然后根據(jù)中間表示調(diào)用通信單元執(zhí)行一個(gè)通信任務(wù)所包括的多個(gè)通信算子中的第一通信算子,并調(diào)用計(jì)算單元執(zhí)行該通信任務(wù)中的計(jì)算算子,或者通知計(jì)算調(diào)度引擎使得計(jì)算調(diào)度引擎調(diào)用計(jì)算單元執(zhí)行該通信任務(wù)中的計(jì)算算子。上述中間表示包括上述通信任務(wù),該通信任務(wù)指示執(zhí)行一次集合通信。

    14、在一種可能的實(shí)現(xiàn)方式中,上述中間表示還包括計(jì)算任務(wù),上述方法還包括:計(jì)算調(diào)度引擎根據(jù)上述中間表示調(diào)用計(jì)算單元執(zhí)行計(jì)算任務(wù)。

    15、在一種可能的實(shí)現(xiàn)方式中,上述計(jì)算調(diào)度引擎根據(jù)中間表示調(diào)用計(jì)算單元執(zhí)行計(jì)算任務(wù),包括:通信調(diào)度引擎在執(zhí)行完通信任務(wù)的情況下,向計(jì)算調(diào)度引擎發(fā)送通知信息;計(jì)算調(diào)度引擎在接收到通知信息的情況下,執(zhí)行中間表示中通信任務(wù)之后的計(jì)算任務(wù)。

    16、在一種可能的實(shí)現(xiàn)方式中,上述方法還包括:計(jì)算調(diào)度引擎在執(zhí)行完計(jì)算任務(wù)的情況下,向通信調(diào)度引擎發(fā)送通知信息;通信調(diào)度引擎在接收到通知信息的情況下,執(zhí)行中間表示中所述計(jì)算任務(wù)之后的通信任務(wù)。

    17、在一種可能的實(shí)現(xiàn)方式中,上述中間表示中的通信任務(wù)由處理器調(diào)用第一函數(shù)產(chǎn)生,第一函數(shù)的輸入為集合通信標(biāo)識(shí)。

    18、在一種可能的實(shí)現(xiàn)方式中,上述通信任務(wù)為全局規(guī)約allreduce或全局收集allgather。

    19、在一種可能的實(shí)現(xiàn)方式中,在通信任務(wù)為allreduce的情況下,上述計(jì)算算子包括量化算子和反量化算子;其中,每個(gè)量化算子指示對(duì)加速器中的部分?jǐn)?shù)據(jù)進(jìn)行量化操作。

    20、在一種可能的實(shí)現(xiàn)方式中,在通信任務(wù)為allgather的情況下,上述計(jì)算算子包括矩陣乘算子。

    21、在一種可能的實(shí)現(xiàn)方式中,上述計(jì)算設(shè)備包括加速器,計(jì)算單元和通信單元位于加速器;該加速器為gpu、npu、tpu或?qū)S萌斯ぶ悄躠i處理芯片。

    22、第三方面,本申請(qǐng)?zhí)峁┮环N計(jì)算設(shè)備,該計(jì)算設(shè)備包括處理器、加速器和存儲(chǔ)器,存儲(chǔ)器用于存儲(chǔ)指令,處理器用于執(zhí)行所述指令,當(dāng)處理器執(zhí)行指令時(shí),調(diào)用加速器實(shí)現(xiàn)如第二方面或第二方面任意一種可能的實(shí)現(xiàn)方式中所述的方法。

    23、第四方面,本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)程序產(chǎn)品,當(dāng)該計(jì)算機(jī)程序產(chǎn)品在服務(wù)器上運(yùn)行時(shí),使得服務(wù)器執(zhí)行第二方面或第二方面任一種可能實(shí)現(xiàn)方式中所述的方法。

    24、第五方面,本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有指令,當(dāng)所述指令在服務(wù)器上運(yùn)行時(shí),使得服務(wù)器執(zhí)行第二方面或第二方面任一種可能實(shí)現(xiàn)方式中所述的方法。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種加速器,其特征在于,包括通信調(diào)度引擎、通信單元,計(jì)算調(diào)度引擎和計(jì)算單元,其中,

    2.根據(jù)權(quán)利要求1所述的加速器,其特征在于,所述中間表示還包括計(jì)算任務(wù),

    3.根據(jù)權(quán)利要求2所述的加速器,其特征在于,

    4.根據(jù)權(quán)利要求2所述的加速器,其特征在于,

    5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的加速器,其特征在于,所述中間表示中的通信任務(wù)由處理器調(diào)用第一函數(shù)產(chǎn)生,所述第一函數(shù)的輸入為集合通信標(biāo)識(shí)。

    6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的加速器,其特征在于,所述通信任務(wù)為全局規(guī)約allreduce或全局收集allgather。

    7.根據(jù)權(quán)利要求6所述的加速器,其特征在于,在所述通信任務(wù)為allreduce的情況下,所述計(jì)算算子包括量化算子和反量化算子;其中,每個(gè)量化算子用于對(duì)所述加速器中的部分?jǐn)?shù)據(jù)進(jìn)行量化操作。

    8.根據(jù)權(quán)利要求6所述的加速器,其特征在于,在所述通信任務(wù)為allgather的情況下,所述計(jì)算算子包括矩陣乘算子。

    9.根據(jù)權(quán)利要求1-8任一項(xiàng)所述的加速器,其特征在于,所述加速器為圖像處理器GPU、神經(jīng)網(wǎng)絡(luò)處理器NPU、張量處理器TPU或?qū)S萌斯ぶ悄蹵I處理芯片。

    10.一種數(shù)據(jù)處理方法,其特征在于,應(yīng)用于計(jì)算設(shè)備,所述計(jì)算設(shè)備包括通信調(diào)度引擎、通信單元、計(jì)算調(diào)度引擎和計(jì)算單元,所述方法包括:

    11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述中間表示還包括計(jì)算任務(wù),所述方法還包括:

    12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述計(jì)算調(diào)度引擎根據(jù)所述中間表示調(diào)用所述計(jì)算單元執(zhí)行所述計(jì)算任務(wù),包括:

    13.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述方法還包括:

    14.根據(jù)權(quán)利要求10-13任一項(xiàng)所述的方法,其特征在于,所述中間表示中的通信任務(wù)由處理器調(diào)用第一函數(shù)產(chǎn)生,所述第一函數(shù)的輸入為集合通信標(biāo)識(shí)。

    15.根據(jù)權(quán)利要求10-14任一項(xiàng)所述的方法,其特征在于,所述通信任務(wù)為全局規(guī)約allreduce或全局收集allgather。

    16.根據(jù)權(quán)利要求15所述的方法,其特征在于,在所述通信任務(wù)為allreduce的情況下,所述計(jì)算算子包括量化算子和反量化算子;其中,每個(gè)量化算子用于對(duì)所述加速器中的部分?jǐn)?shù)據(jù)進(jìn)行量化操作。

    17.根據(jù)權(quán)利要求15所述的方法,其特征在于,在所述通信任務(wù)為allgather的情況下,所述計(jì)算算子包括矩陣乘算子。

    18.根據(jù)權(quán)利要求10-17任一項(xiàng)所述的方法,其特征在于,所述計(jì)算設(shè)備包括加速器,所述計(jì)算單元和所述通信單元位于所述加速器;所述加速器為圖像處理器GPU、神經(jīng)網(wǎng)絡(luò)處理器NPU、張量處理器TPU或?qū)S萌斯ぶ悄蹵I處理芯片。

    19.一種計(jì)算設(shè)備,其特征在于,所述計(jì)算設(shè)備包括處理器、加速器和存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)指令,所述處理器用于執(zhí)行所述指令,當(dāng)所述處理器執(zhí)行所述指令時(shí),調(diào)用所述加速器實(shí)現(xiàn)如權(quán)利要求10至18中任意一項(xiàng)所述的方法。

    20.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,包括計(jì)算機(jī)程序指令,當(dāng)所述計(jì)算機(jī)程序指令由計(jì)算設(shè)備執(zhí)行時(shí),所述計(jì)算設(shè)備執(zhí)行如權(quán)利要求10至18中任意一項(xiàng)所述的方法。

    ...

    【技術(shù)特征摘要】

    1.一種加速器,其特征在于,包括通信調(diào)度引擎、通信單元,計(jì)算調(diào)度引擎和計(jì)算單元,其中,

    2.根據(jù)權(quán)利要求1所述的加速器,其特征在于,所述中間表示還包括計(jì)算任務(wù),

    3.根據(jù)權(quán)利要求2所述的加速器,其特征在于,

    4.根據(jù)權(quán)利要求2所述的加速器,其特征在于,

    5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的加速器,其特征在于,所述中間表示中的通信任務(wù)由處理器調(diào)用第一函數(shù)產(chǎn)生,所述第一函數(shù)的輸入為集合通信標(biāo)識(shí)。

    6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的加速器,其特征在于,所述通信任務(wù)為全局規(guī)約allreduce或全局收集allgather。

    7.根據(jù)權(quán)利要求6所述的加速器,其特征在于,在所述通信任務(wù)為allreduce的情況下,所述計(jì)算算子包括量化算子和反量化算子;其中,每個(gè)量化算子用于對(duì)所述加速器中的部分?jǐn)?shù)據(jù)進(jìn)行量化操作。

    8.根據(jù)權(quán)利要求6所述的加速器,其特征在于,在所述通信任務(wù)為allgather的情況下,所述計(jì)算算子包括矩陣乘算子。

    9.根據(jù)權(quán)利要求1-8任一項(xiàng)所述的加速器,其特征在于,所述加速器為圖像處理器gpu、神經(jīng)網(wǎng)絡(luò)處理器npu、張量處理器tpu或?qū)S萌斯ぶ悄躠i處理芯片。

    10.一種數(shù)據(jù)處理方法,其特征在于,應(yīng)用于計(jì)算設(shè)備,所述計(jì)算設(shè)備包括通信調(diào)度引擎、通信單元、計(jì)算調(diào)度引擎和計(jì)算單元,所述方法包括:

    11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述中間表示還包括計(jì)算任務(wù),所述方法還包括:

    12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述計(jì)算調(diào)度引擎...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:端啟航
    申請(qǐng)(專利權(quán))人:華為技術(shù)有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 亚洲综合无码AV一区二区| 成人无码精品一区二区三区| 日韩乱码人妻无码中文字幕久久 | 国产精品无码久久四虎| 少妇无码?V无码专区在线观看| 亚洲精品无码久久久影院相关影片| 亚洲AV综合色区无码二区偷拍 | 中文字幕无码免费久久| 亚洲a∨无码一区二区| 精品久久久久久无码国产| 亚洲一区AV无码少妇电影| 高清无码视频直接看| 无码AV一区二区三区无码| 亚洲精品偷拍无码不卡av| 国产50部艳色禁片无码| 中文字幕丰满乱孑伦无码专区| 国产精品无码久久四虎| 蜜臀AV无码精品人妻色欲| 久久无码无码久久综合综合| 永久免费AV无码网站国产| 久久久久久国产精品无码下载 | 中文精品无码中文字幕无码专区| 久久亚洲AV无码精品色午夜| 色欲A∨无码蜜臀AV免费播| 在线精品无码字幕无码AV| 日韩精品无码一区二区三区四区| 午夜亚洲av永久无码精品| 无码国模国产在线观看| 国产精品午夜无码体验区| 国产免费AV片无码永久免费| 国产精品无码MV在线观看| 日韩中文无码有码免费视频| 无码8090精品久久一区| 国产精品一级毛片无码视频| 国产精品无码免费专区午夜| 潮喷失禁大喷水aⅴ无码| 中文字幕乱偷无码AV先锋| 性无码一区二区三区在线观看| 国产∨亚洲V天堂无码久久久| 无码专区狠狠躁躁天天躁| 永久免费av无码不卡在线观看|