System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 麻豆精品无码国产在线果冻,无码人妻精品一区二区三区99仓本,亚洲Av无码国产一区二区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    加速器芯片指令運(yùn)行分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品制造方法及圖紙

    技術(shù)編號:44528169 閱讀:4 留言:0更新日期:2025-03-07 13:18
    本申請涉及一種加速器芯片指令運(yùn)行分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品。所述方法包括:通過獲取加速器芯片執(zhí)行目標(biāo)核函數(shù)對應(yīng)的二進(jìn)制文件所得到的多個數(shù)據(jù)流,然后,根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼,再按照時鐘周期的時序先后順序,依次將每個所述匯編指令代碼與所述匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到所述匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,所述指令代碼分析結(jié)果包括所述加速器芯片執(zhí)行所述匯編指令代碼所需的時鐘周期數(shù)量以及所述匯編指令代碼對應(yīng)的執(zhí)行次數(shù)中的至少一種。采用本方法能夠提高分析結(jié)果的精確度。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本申請涉及高性能計(jì)算機(jī),特別是涉及一種加速器芯片指令運(yùn)行分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品。


    技術(shù)介紹

    1、隨著計(jì)算機(jī)技術(shù)的發(fā)展,高性能計(jì)算機(jī)被廣泛使用。高性能計(jì)算機(jī),指通過集群和專用加速器芯片進(jìn)行加速的計(jì)算機(jī)系統(tǒng),其具有計(jì)算復(fù)雜度高、計(jì)算數(shù)據(jù)量大的特點(diǎn),通常用于科學(xué)計(jì)算、深度學(xué)習(xí)訓(xùn)練推理等領(lǐng)域。為了優(yōu)化高性能計(jì)算機(jī)的計(jì)算性能,通常需要對加速器芯片的專用程序—核函數(shù)進(jìn)行研究。

    2、現(xiàn)有技術(shù)中,通常使用roc?prof(gpu性能分析工具)對加速器芯片上運(yùn)行的核函數(shù)的運(yùn)行狀態(tài)進(jìn)行分析,核函數(shù)的分析結(jié)果能夠顯示核函數(shù)所包含的各類指令的運(yùn)行過程,但是,通過上述方法得到的分析結(jié)果存在精確度低的問題。


    技術(shù)實(shí)現(xiàn)思路

    1、基于此,有必要針對上述技術(shù)問題,提供一種能夠提高核函數(shù)的分析結(jié)果的精確度的加速器芯片指令運(yùn)行分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品。

    2、第一方面,本申請?zhí)峁┝艘环N加速器芯片指令運(yùn)行分析方法。所述方法包括:

    3、獲取加速器芯片執(zhí)行目標(biāo)核函數(shù)對應(yīng)的二進(jìn)制文件所得到的多個數(shù)據(jù)流;

    4、根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼;

    5、按照時鐘周期的時序先后順序,依次將每個所述匯編指令代碼與所述匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到所述匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,所述指令代碼分析結(jié)果包括所述加速器芯片執(zhí)行所述匯編指令代碼所需的時鐘周期數(shù)量以及所述匯編指令代碼對應(yīng)的執(zhí)行次數(shù)中的至少一種。

    6、在時鐘周期上對各匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行分析,所得到的指令代碼分析結(jié)果能夠精確地反映每條匯編指令代碼的運(yùn)行過程,例如可以反映執(zhí)行匯編指令代碼所需的時鐘周期數(shù)量、匯編指令代碼對應(yīng)的執(zhí)行次數(shù)等,避免了傳統(tǒng)技術(shù)中使用roc?prof對加速器芯片上運(yùn)行的核函數(shù)進(jìn)行分析時,得到的分析結(jié)果僅能大致反映各類型的匯編指令代碼的運(yùn)行過程所導(dǎo)致的分析結(jié)果精確度低的問題,本申請實(shí)施例所提供的加速器芯片指令運(yùn)行分析方法,細(xì)化了核函數(shù)分析的分析粒度,所得到的指令代碼分析結(jié)果更加精確。

    7、在其中一個實(shí)施例中,根據(jù)二進(jìn)制文件,獲取二進(jìn)制文件對應(yīng)的多個匯編指令代碼,包括:

    8、通過性能分析工具,對二進(jìn)制文件進(jìn)行反匯編處理,得到二進(jìn)制文件對應(yīng)的多個匯編指令代碼。

    9、本實(shí)施例中直接利用具有反匯編能力的性能分析工具對二進(jìn)制文件進(jìn)行自動的反匯編處理,提高了反匯編的效率。

    10、在其中一個實(shí)施例中,按照時鐘周期的時序先后順序,依次將每個匯編指令代碼與匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,包括:

    11、按照時鐘周期的時序先后順序,依次將每個匯編指令代碼與匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,確定匯編指令代碼對應(yīng)的執(zhí)行開始時間、執(zhí)行結(jié)束時間以及匯編指令代碼對應(yīng)的執(zhí)行次數(shù);

    12、根據(jù)執(zhí)行開始時間和執(zhí)行結(jié)束時間,確定執(zhí)行匯編指令代碼所需的時鐘周期數(shù)量。

    13、本實(shí)施例中,計(jì)算機(jī)設(shè)備按照時序的先后順序?qū)Ω鲄R編指令代碼與各數(shù)據(jù)流依次匹配,匹配方法更加便捷,通過匹配處理后,確定各匯編指令代碼對應(yīng)的執(zhí)行開始時間和執(zhí)行結(jié)束時間、匯編指令代碼的執(zhí)行次數(shù)以及所需的時鐘周期數(shù)量,使得開發(fā)人員能根據(jù)上述實(shí)施例獲得的指令代碼分析結(jié)果快速確定目標(biāo)核函數(shù)需要優(yōu)化改進(jìn)的地方,提高了開發(fā)人員優(yōu)化目標(biāo)核函數(shù)的效率。

    14、在其中一個實(shí)施例中,所述方法還包括:

    15、按照預(yù)設(shè)的顯示方式,對各匯編指令代碼對應(yīng)的指令代碼分析結(jié)果進(jìn)行可視化顯示。

    16、本實(shí)施例中,計(jì)算機(jī)設(shè)備將各匯編指令代碼對應(yīng)的指令代碼分析結(jié)果按照預(yù)設(shè)的顯示方式進(jìn)行可視化顯示,更直觀地反映了各匯編指令代碼對應(yīng)的令代碼分析結(jié)果,使得開發(fā)人員能更直觀、精確地確定各匯編指令代碼的運(yùn)行情況,從而提升優(yōu)化目標(biāo)核函數(shù)的效率。

    17、在其中一個實(shí)施例中,按照預(yù)設(shè)的顯示方式,對各匯編指令代碼對應(yīng)的指令代碼分析結(jié)果進(jìn)行可視化顯示,包括:

    18、確定各匯編指令代碼所屬的指令類別,以及指令類別對應(yīng)的加速器芯片中的計(jì)算單元;

    19、在預(yù)設(shè)的顯示界面中,將指令類別下的各指令代碼分析結(jié)果與指令類別對應(yīng)的計(jì)算單元的計(jì)算單元標(biāo)識對應(yīng)顯示。

    20、本實(shí)施例在對指令代碼分析結(jié)果可視化展示過程中,不僅展示展示了匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,還展示了各匯編指令代碼對應(yīng)的指令類別和計(jì)算單元,展示維度更加豐富。

    21、在其中一個實(shí)施例中,在預(yù)設(shè)的顯示界面中,將指令類別下的各指令代碼分析結(jié)果與指令類別對應(yīng)的計(jì)算單元的計(jì)算單元標(biāo)識對應(yīng)顯示,包括:

    22、對于計(jì)算單元標(biāo)識對應(yīng)的每個指令類別,在顯示界面中按照時鐘周期的時序先后順序,顯示指令類別對應(yīng)的時間線控件,以顯示指令類別下各匯編指令代碼的各指令代碼分析結(jié)果。

    23、本實(shí)施例中,時間線控件能夠在時序上更加形象地展示各指令代碼分析結(jié)果。

    24、在其中一個實(shí)施例中,時間線控件用于顯示指令類別下各匯編指令代碼被執(zhí)行的時鐘周期,方法還包括:

    25、若檢測到針對目標(biāo)時間線控件的點(diǎn)擊操作,則確定目標(biāo)時間線控件對應(yīng)的目標(biāo)匯編指令代碼,并在顯示界面的預(yù)設(shè)位置中顯示目標(biāo)匯編指令代碼的指令代碼分析結(jié)果。

    26、本實(shí)施例中,指令代碼分析結(jié)果被更加詳細(xì)地展示在預(yù)設(shè)位置。

    27、第二方面,本申請還提供了一種加速器芯片指令運(yùn)行分析裝置。所述裝置包括:

    28、第一獲取模塊,用于獲取加速器芯片執(zhí)行目標(biāo)核函數(shù)對應(yīng)的二進(jìn)制文件所得到的多個數(shù)據(jù)流;

    29、第二獲取模塊,用于根據(jù)二進(jìn)制文件,獲取二進(jìn)制文件對應(yīng)的多個匯編指令代碼;

    30、匹配模塊,用于按照時鐘周期的時序先后順序,依次將每個匯編指令代碼與匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,指令代碼分析結(jié)果包括加速器芯片執(zhí)行匯編指令代碼所需的時鐘周期數(shù)量以及匯編指令代碼對應(yīng)的執(zhí)行次數(shù)中的至少一種。

    31、第三方面,本申請還提供了一種計(jì)算機(jī)設(shè)備。所述計(jì)算機(jī)設(shè)備包括存儲器和處理器,所述存儲器存儲有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)如上述第一方面所述的方法的步驟。

    32、第四方面,本申請還提供了一種計(jì)算機(jī)可讀存儲介質(zhì)。所述計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如上述第一方面所述的方法的步驟。

    33、第五方面,本申請還提供了一種計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如上述第一方面所述的方法的步驟。

    34、上述加速器芯片指令運(yùn)行分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品,通過獲取加速器芯片執(zhí)行目標(biāo)核函數(shù)對應(yīng)的二進(jìn)制文件所得到的多個數(shù)據(jù)流,然后,根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼,再按照時鐘周期的時序先后順序,依次將每個本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種加速器芯片指令運(yùn)行分析方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼,包括:

    3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照時鐘周期的時序先后順序,依次將每個所述匯編指令代碼與所述匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到所述匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,包括:

    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述在預(yù)設(shè)的顯示界面中,將所述指令類別下的各所述指令代碼分析結(jié)果與所述指令類別對應(yīng)的所述計(jì)算單元的計(jì)算單元標(biāo)識對應(yīng)顯示,包括:

    6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述時間線控件用于顯示所述指令類別下各所述匯編指令代碼被執(zhí)行的時鐘周期,所述方法還包括:

    7.一種加速器芯片指令運(yùn)行分析裝置,其特征在于,所述裝置包括:

    8.一種計(jì)算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。

    9.一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。

    10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種加速器芯片指令運(yùn)行分析方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼,包括:

    3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照時鐘周期的時序先后順序,依次將每個所述匯編指令代碼與所述匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到所述匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,包括:

    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述在預(yù)設(shè)的顯示界面中,將所述指令類別下的各所述指令代碼分析結(jié)果與所述指令類別對應(yīng)的所述計(jì)算單元的計(jì)算單元標(biāo)識對應(yīng)顯示,包括:

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:李志功,肖熠卜景德
    申請(專利權(quán))人:曙光信息產(chǎn)業(yè)北京有限公司,
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 日韩综合无码一区二区| 无码狠狠躁久久久久久久| 亚洲精品无码久久千人斩| 日韩va中文字幕无码电影| 在线观看无码不卡AV| 亚洲精品午夜无码电影网| 亚洲av无码有乱码在线观看| 国产无码网页在线观看| 亚洲日韩AV无码一区二区三区人| 国产精品无码a∨精品| 亚洲av无码一区二区三区天堂| 伊人久久无码精品中文字幕| 免费A级毛片无码A∨| 亚洲精品无码MV在线观看| 人妻中文字幕AV无码专区| AV无码免费永久在线观看| 亚洲av无码片在线播放| 永久免费AV无码网站国产| 2020无码专区人妻系列日韩| 在线观看无码AV网站永久免费| 无码国内精品久久人妻蜜桃| 亚洲va无码va在线va天堂| 国精品无码A区一区二区| 国产精品无码aⅴ嫩草| 色欲AV永久无码精品无码| 亚洲日韩乱码中文无码蜜桃| 久久无码专区国产精品s| 久久午夜无码鲁丝片直播午夜精品 | 性色av无码免费一区二区三区| 人妻少妇偷人精品无码| 少妇人妻无码精品视频| 精品亚洲A∨无码一区二区三区| av无码人妻一区二区三区牛牛| 日韩美无码五月天| 亚洲AV无码之日韩精品| 粉嫩高中生无码视频在线观看| 一级毛片中出无码| 国产成人无码区免费内射一片色欲| 国模无码一区二区三区不卡| 亚洲中文字幕无码久久综合网| 国产成人精品无码片区在线观看|