System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 69成人免费视频无码专区,亚洲ⅴ国产v天堂a无码二区,中文字幕精品无码一区二区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    人工智能加速卡推理性能檢測方法、裝置、電子設備、存儲介質及計算機程序產品制造方法及圖紙

    技術編號:43044758 閱讀:14 留言:0更新日期:2024-10-22 14:30
    本申請提供了一種人工智能加速卡推理性能檢測方法、裝置、電子設備、存儲介質及計算機程序產品,涉及技術領域為:加速卡測試技術領域,方法包括:基于預設應用類別以及加速卡的基本信息,確定配置信息集合;其中,配置信息集合包括對加速卡進行預設應用類別的性能檢測時的配置信息;基于配置信息集合對加速卡進行推理測試,確定性能檢測結果。這樣,由于本申請在進行加速卡性能測試時考慮到加速卡的基本信息的同時也考慮到了對加速卡進行預設應用類別測試時的配置需求,所以確定的性能檢測結果與加速卡在預設應用類別場景下的性能表現更加貼合,進而確定的性能檢測結果準確度更高。

    【技術實現步驟摘要】

    本申請涉及加速卡測試,尤其涉及一種人工智能加速卡推理性能檢測方法、裝置、電子設備、存儲介質及計算機程序產品。


    技術介紹

    1、人工智能加速卡是人工智能時代重要的算力基礎,隨著人工智能技術及國內外人工智能加速卡廠商的迅速發展,人工智能加速卡的應用范圍和場景從特定專用向廣泛通用快速發展。在推理場景中,人工智能加速卡主要用于將訓練好的算法或模型部署到應用或服務中,人工智能加速卡的推理性能是其核心性能指標。由于不同人工智能加速卡的硬件架構差異大,相配套的軟件棧多樣,導致無法通過簡單的方式進行人工智能加速卡推理性能的評估?,F有的測試方法如下:通過使用人工智能加速卡自帶的性能測試工具,對人工智能加速卡的推理性能進行測試。通常情況下僅能反映被測人工智能加速卡的理論算力(與標稱值接近),無法準確反映被測人工智能加速卡在特定推理場景下的的性能表現,且考慮到人工智能加速卡的推理性能表現是其硬件、軟件棧與操作系統等綜合配合的表現,理論算力的高低與推理性能的高低不具有直接關聯關系,因此該方法確定的推理性能與特定推理場景下的實際性能表現相差較大。


    技術實現思路

    1、本申請實施例提供的一種人工智能加速卡推理性能檢測方法、裝置、電子設備、存儲介質及計算機程序產品,可以提高在特定推理場景下的推理性能檢測準確度。

    2、本申請的技術方案是這樣實現的:

    3、本申請實施例提供了一種人工智能加速卡推理性能檢測方法,包括:

    4、基于預設應用類別以及加速卡的基本信息,確定配置信息集合;其中,所述配置信息集合包括對所述加速卡進行所述預設應用類別的性能檢測時的配置信息;

    5、基于所述配置信息集合對所述加速卡進行推理測試,確定性能檢測結果。

    6、上述方案中,所述配置信息集合包括:模型網絡、推理數據和推理配置數據;所述基于預設應用類別以及加速卡的基本屬性,確定配置信息集合,包括:

    7、獲取所述加速卡的所述基本信息;

    8、基于所述預設應用類別確定匹配的所述模型網絡和所述推理數據;

    9、通過預設程序對所述基本信息、所述模型網絡和所述推理數據進行處理確定所述推理配置數據;其中,所述推理配置數據用于表征對所述加速卡進行所述預設應用類別的性能檢測時的數據輸入配置信息,以及加速卡數量配置信息。

    10、上述方案中,所述數據輸入配置信息包括:對每一所述加速卡進行所述預設應用類別的性能檢測時的數據批量大小信息和數據輸入大小信息。

    11、上述方案中,所述基于所述配置信息集合對所述加速卡進行推理測試,確定性能檢測結果,包括:

    12、將所述模型網絡針對所述加速卡進行轉換并配置在所述加速卡上;

    13、按照所述數據輸入配置信息將所述推理數據輸入到所述加速卡中進行推理測試;其中,參與推理測試的所述加速卡數量是基于所述加速卡數量配置信息確定的;

    14、獲取針對所述加速卡進行推理測試過程中的推理指標,以及針對所述推理數據的推理結果;

    15、基于所述推理指標和所述推理結果確定所述性能檢測結果。

    16、上述方案中,所述基于所述推理指標和所述推理結果確定所述性能檢測結果,包括:

    17、基于所述推理結果與所述推理數據對應的真實結果,確定針對所述加速卡的推理精度信息;

    18、基于所述推理指標和所述推理精度信息確定所述性能檢測結果。

    19、上述方案中,所述推理指標包括以下中的一個或多個:硬件推理時長、端到端推理時長、端到端推理吞吐率和硬件推理吞吐率。

    20、上述方案中,所述預設應用類別包括:多個子預設應用類別;所述配置信息集合包括:每一所述子預設應用類別對應的子配置信息集合;

    21、所述基于所述配置信息集合對所述加速卡進行推理測試,確定性能檢測結果,包括:

    22、基于每一所述子配置信息集合對所述加速卡進行推理測試,確定對應每一所述子配置信息集合的子檢測結果;

    23、聯合每一所述子檢測結果確定所述性能檢測結果。

    24、本申請實施例還提供了一種人工智能加速卡推理性能檢測裝置,包括:

    25、確定單元,用于基于預設應用類別以及加速卡的基本信息,確定配置信息集合;其中,所述配置信息集合包括對所述加速卡進行所述預設應用類別的性能檢測時的配置信息;

    26、推理檢測單元,用于基于所述配置信息集合對所述加速卡進行推理測試,確定性能檢測結果。

    27、本申請實施例還提供了一種電子設備,包括存儲器和處理器,所述存儲器存儲有可在處理器上運行的計算機程序,所述處理器執行所述程序時實現上述方法中的步驟。

    28、本申請實施例還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現上述方法中的步驟。

    29、本申請實施例還提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現上述方法中的步驟。

    30、本申請實施例中,基于預設應用類別以及加速卡的基本信息,確定配置信息集合;其中,配置信息集合包括對加速卡進行預設應用類別的性能檢測時的配置信息;基于配置信息集合對加速卡進行推理測試,確定性能檢測結果。這樣,由于配置信息集合中包括了對加速卡進行預設應用類別的性能檢測時的配置信息,所以利用該配置信息集合對加速卡進行推理測試時,考慮到加速卡的基本信息的同時也考慮到了對加速卡進行預設應用類別測試時的配置需求,所以確定的性能檢測結果與加速卡在預設應用類別場景下的性能表現更加貼合,進而確定的性能檢測結果準確度更高。

    本文檔來自技高網...

    【技術保護點】

    1.一種人工智能加速卡推理性能檢測方法,其特征在于,包括:

    2.根據權利要求1所述的人工智能加速卡推理性能檢測方法,其特征在于,所述配置信息集合包括:模型網絡、推理數據和推理配置數據;所述基于預設應用類別以及加速卡的基本屬性,確定配置信息集合,包括:

    3.根據權利要求2所述的人工智能加速卡推理性能檢測方法,其特征在于,所述數據輸入配置信息包括:對每一所述加速卡進行所述預設應用類別的性能檢測時的數據批量大小信息和數據輸入大小信息。

    4.根據權利要求2或3所述的人工智能加速卡推理性能檢測方法,其特征在于,所述基于所述配置信息集合對所述加速卡進行推理測試,確定性能檢測結果,包括:

    5.根據權利要求4所述的人工智能加速卡推理性能檢測方法,其特征在于,所述基于所述推理指標和所述推理結果確定所述性能檢測結果,包括:

    6.根據權利要求5所述的人工智能加速卡推理性能檢測方法,其特征在于,所述推理指標包括以下中的一個或多個:硬件推理時長、端到端推理時長、端到端推理吞吐率和硬件推理吞吐率。

    7.根據權利要求1所述的人工智能加速卡推理性能檢測方法,其特征在于,所述預設應用類別包括:多個子預設應用類別;所述配置信息集合包括:每一所述子預設應用類別對應的子配置信息集合;

    8.一種人工智能加速卡推理性能檢測裝置,其特征在于,包括:

    9.一種電子設備,其特征在于,包括存儲器和處理器,所述存儲器存儲有可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現權利要求1至7任一項所述方法中的步驟。

    10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7任一項所述方法中的步驟。

    11.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序在被處理器執行時實現權利要求1至7任一項所述方法中的步驟。

    ...

    【技術特征摘要】

    1.一種人工智能加速卡推理性能檢測方法,其特征在于,包括:

    2.根據權利要求1所述的人工智能加速卡推理性能檢測方法,其特征在于,所述配置信息集合包括:模型網絡、推理數據和推理配置數據;所述基于預設應用類別以及加速卡的基本屬性,確定配置信息集合,包括:

    3.根據權利要求2所述的人工智能加速卡推理性能檢測方法,其特征在于,所述數據輸入配置信息包括:對每一所述加速卡進行所述預設應用類別的性能檢測時的數據批量大小信息和數據輸入大小信息。

    4.根據權利要求2或3所述的人工智能加速卡推理性能檢測方法,其特征在于,所述基于所述配置信息集合對所述加速卡進行推理測試,確定性能檢測結果,包括:

    5.根據權利要求4所述的人工智能加速卡推理性能檢測方法,其特征在于,所述基于所述推理指標和所述推理結果確定所述性能檢測結果,包括:

    6.根據權利要求5所述的人工智能加速卡推理性能檢測方法,其特征在...

    【專利技術屬性】
    技術研發人員:劉振,王汝佳,張鵬飛唐本亭楊???/a>,郗卓寧,魯江華馮保強,朱瑞平
    申請(專利權)人:中國移動通信有限公司研究院,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 日韩夜夜高潮夜夜爽无码| 无码人妻精品一区二区三区久久| 中文字幕无码不卡免费视频| 无码熟妇人妻AV影音先锋| 亚洲成A人片在线观看无码3D| 国产亚洲?V无码?V男人的天堂| 久久人妻少妇嫩草AV无码专区 | 亚洲AV无码一区二区乱子伦| 无码夫の前で人妻を侵犯| 中文字幕无码毛片免费看| 无码熟妇人妻AV在线影院| 国产成人无码AⅤ片在线观看| 人妻丰满熟妇AV无码区免| 亚洲av永久无码精品表情包| 国产成人无码精品一区不卡| 无码人妻精品一区二区蜜桃网站 | 亚洲精品无码专区2| 亚洲6080yy久久无码产自国产| 亚洲AV永久无码精品一百度影院| 国产精品免费看久久久无码| 2019亚洲午夜无码天堂| 色欲A∨无码蜜臀AV免费播| H无码精品3D动漫在线观看| 丰满亚洲大尺度无码无码专线| 少妇精品无码一区二区三区 | 久久天堂av综合色无码专区| 人妻丰满av无码中文字幕| 亚洲Av综合色区无码专区桃色| 国产无码一区二区在线| 精品久久久久久无码国产| 一本大道久久东京热无码AV| 无码av不卡一区二区三区| 国产精品成人99一区无码| 无码午夜人妻一区二区不卡视频| 永久免费AV无码国产网站| 亚洲日韩av无码中文| 久久亚洲精品无码网站| 日韩中文无码有码免费视频| 爆乳无码AV一区二区三区 | 日韩精品无码久久一区二区三| 国产精品va无码免费麻豆|