System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請涉及高性能計(jì)算機(jī),特別是涉及一種加速器芯片指令運(yùn)行分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品。
技術(shù)介紹
1、隨著計(jì)算機(jī)技術(shù)的發(fā)展,高性能計(jì)算機(jī)被廣泛使用。高性能計(jì)算機(jī),指通過集群和專用加速器芯片進(jìn)行加速的計(jì)算機(jī)系統(tǒng),其具有計(jì)算復(fù)雜度高、計(jì)算數(shù)據(jù)量大的特點(diǎn),通常用于科學(xué)計(jì)算、深度學(xué)習(xí)訓(xùn)練推理等領(lǐng)域。為了優(yōu)化高性能計(jì)算機(jī)的計(jì)算性能,通常需要對加速器芯片的專用程序—核函數(shù)進(jìn)行研究。
2、現(xiàn)有技術(shù)中,通常使用roc?prof(gpu性能分析工具)對加速器芯片上運(yùn)行的核函數(shù)的運(yùn)行狀態(tài)進(jìn)行分析,核函數(shù)的分析結(jié)果能夠顯示核函數(shù)所包含的各類指令的運(yùn)行過程,但是,通過上述方法得到的分析結(jié)果存在精確度低的問題。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對上述技術(shù)問題,提供一種能夠提高核函數(shù)的分析結(jié)果的精確度的加速器芯片指令運(yùn)行分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品。
2、第一方面,本申請?zhí)峁┝艘环N加速器芯片指令運(yùn)行分析方法。所述方法包括:
3、獲取加速器芯片執(zhí)行目標(biāo)核函數(shù)對應(yīng)的二進(jìn)制文件所得到的多個數(shù)據(jù)流;
4、根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼;
5、按照時鐘周期的時序先后順序,依次將每個所述匯編指令代碼與所述匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到所述匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,所述指令代碼分析結(jié)果包括所述加速器芯片執(zhí)行所述匯編指令代碼所需的時鐘周期數(shù)量以及所述匯編指令代碼對應(yīng)的執(zhí)行次數(shù)中的至少一種。
6
7、在其中一個實(shí)施例中,根據(jù)二進(jìn)制文件,獲取二進(jìn)制文件對應(yīng)的多個匯編指令代碼,包括:
8、通過性能分析工具,對二進(jìn)制文件進(jìn)行反匯編處理,得到二進(jìn)制文件對應(yīng)的多個匯編指令代碼。
9、本實(shí)施例中直接利用具有反匯編能力的性能分析工具對二進(jìn)制文件進(jìn)行自動的反匯編處理,提高了反匯編的效率。
10、在其中一個實(shí)施例中,按照時鐘周期的時序先后順序,依次將每個匯編指令代碼與匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,包括:
11、按照時鐘周期的時序先后順序,依次將每個匯編指令代碼與匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,確定匯編指令代碼對應(yīng)的執(zhí)行開始時間、執(zhí)行結(jié)束時間以及匯編指令代碼對應(yīng)的執(zhí)行次數(shù);
12、根據(jù)執(zhí)行開始時間和執(zhí)行結(jié)束時間,確定執(zhí)行匯編指令代碼所需的時鐘周期數(shù)量。
13、本實(shí)施例中,計(jì)算機(jī)設(shè)備按照時序的先后順序?qū)Ω鲄R編指令代碼與各數(shù)據(jù)流依次匹配,匹配方法更加便捷,通過匹配處理后,確定各匯編指令代碼對應(yīng)的執(zhí)行開始時間和執(zhí)行結(jié)束時間、匯編指令代碼的執(zhí)行次數(shù)以及所需的時鐘周期數(shù)量,使得開發(fā)人員能根據(jù)上述實(shí)施例獲得的指令代碼分析結(jié)果快速確定目標(biāo)核函數(shù)需要優(yōu)化改進(jìn)的地方,提高了開發(fā)人員優(yōu)化目標(biāo)核函數(shù)的效率。
14、在其中一個實(shí)施例中,所述方法還包括:
15、按照預(yù)設(shè)的顯示方式,對各匯編指令代碼對應(yīng)的指令代碼分析結(jié)果進(jìn)行可視化顯示。
16、本實(shí)施例中,計(jì)算機(jī)設(shè)備將各匯編指令代碼對應(yīng)的指令代碼分析結(jié)果按照預(yù)設(shè)的顯示方式進(jìn)行可視化顯示,更直觀地反映了各匯編指令代碼對應(yīng)的令代碼分析結(jié)果,使得開發(fā)人員能更直觀、精確地確定各匯編指令代碼的運(yùn)行情況,從而提升優(yōu)化目標(biāo)核函數(shù)的效率。
17、在其中一個實(shí)施例中,按照預(yù)設(shè)的顯示方式,對各匯編指令代碼對應(yīng)的指令代碼分析結(jié)果進(jìn)行可視化顯示,包括:
18、確定各匯編指令代碼所屬的指令類別,以及指令類別對應(yīng)的加速器芯片中的計(jì)算單元;
19、在預(yù)設(shè)的顯示界面中,將指令類別下的各指令代碼分析結(jié)果與指令類別對應(yīng)的計(jì)算單元的計(jì)算單元標(biāo)識對應(yīng)顯示。
20、本實(shí)施例在對指令代碼分析結(jié)果可視化展示過程中,不僅展示展示了匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,還展示了各匯編指令代碼對應(yīng)的指令類別和計(jì)算單元,展示維度更加豐富。
21、在其中一個實(shí)施例中,在預(yù)設(shè)的顯示界面中,將指令類別下的各指令代碼分析結(jié)果與指令類別對應(yīng)的計(jì)算單元的計(jì)算單元標(biāo)識對應(yīng)顯示,包括:
22、對于計(jì)算單元標(biāo)識對應(yīng)的每個指令類別,在顯示界面中按照時鐘周期的時序先后順序,顯示指令類別對應(yīng)的時間線控件,以顯示指令類別下各匯編指令代碼的各指令代碼分析結(jié)果。
23、本實(shí)施例中,時間線控件能夠在時序上更加形象地展示各指令代碼分析結(jié)果。
24、在其中一個實(shí)施例中,時間線控件用于顯示指令類別下各匯編指令代碼被執(zhí)行的時鐘周期,方法還包括:
25、若檢測到針對目標(biāo)時間線控件的點(diǎn)擊操作,則確定目標(biāo)時間線控件對應(yīng)的目標(biāo)匯編指令代碼,并在顯示界面的預(yù)設(shè)位置中顯示目標(biāo)匯編指令代碼的指令代碼分析結(jié)果。
26、本實(shí)施例中,指令代碼分析結(jié)果被更加詳細(xì)地展示在預(yù)設(shè)位置。
27、第二方面,本申請還提供了一種加速器芯片指令運(yùn)行分析裝置。所述裝置包括:
28、第一獲取模塊,用于獲取加速器芯片執(zhí)行目標(biāo)核函數(shù)對應(yīng)的二進(jìn)制文件所得到的多個數(shù)據(jù)流;
29、第二獲取模塊,用于根據(jù)二進(jìn)制文件,獲取二進(jìn)制文件對應(yīng)的多個匯編指令代碼;
30、匹配模塊,用于按照時鐘周期的時序先后順序,依次將每個匯編指令代碼與匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,指令代碼分析結(jié)果包括加速器芯片執(zhí)行匯編指令代碼所需的時鐘周期數(shù)量以及匯編指令代碼對應(yīng)的執(zhí)行次數(shù)中的至少一種。
31、第三方面,本申請還提供了一種計(jì)算機(jī)設(shè)備。所述計(jì)算機(jī)設(shè)備包括存儲器和處理器,所述存儲器存儲有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)如上述第一方面所述的方法的步驟。
32、第四方面,本申請還提供了一種計(jì)算機(jī)可讀存儲介質(zhì)。所述計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如上述第一方面所述的方法的步驟。
33、第五方面,本申請還提供了一種計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如上述第一方面所述的方法的步驟。
34、上述加速器芯片指令運(yùn)行分析方法、裝置、設(shè)備、介質(zhì)和產(chǎn)品,通過獲取加速器芯片執(zhí)行目標(biāo)核函數(shù)對應(yīng)的二進(jìn)制文件所得到的多個數(shù)據(jù)流,然后,根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼,再按照時鐘周期的時序先后順序,依次將每個本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種加速器芯片指令運(yùn)行分析方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照時鐘周期的時序先后順序,依次將每個所述匯編指令代碼與所述匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到所述匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述在預(yù)設(shè)的顯示界面中,將所述指令類別下的各所述指令代碼分析結(jié)果與所述指令類別對應(yīng)的所述計(jì)算單元的計(jì)算單元標(biāo)識對應(yīng)顯示,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述時間線控件用于顯示所述指令類別下各所述匯編指令代碼被執(zhí)行的時鐘周期,所述方法還包括:
7.一種加速器芯片指令運(yùn)行分析裝置,其特征在于,所述裝置包括:
8.一種計(jì)算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序
9.一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。
...【技術(shù)特征摘要】
1.一種加速器芯片指令運(yùn)行分析方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述二進(jìn)制文件,獲取所述二進(jìn)制文件對應(yīng)的多個匯編指令代碼,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照時鐘周期的時序先后順序,依次將每個所述匯編指令代碼與所述匯編指令代碼對應(yīng)的數(shù)據(jù)流進(jìn)行匹配處理,得到所述匯編指令代碼對應(yīng)的指令代碼分析結(jié)果,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述在預(yù)設(shè)的顯示界面中,將所述指令類別下的各所述指令代碼分析結(jié)果與所述指令類別對應(yīng)的所述計(jì)算單元的計(jì)算單元標(biāo)識對應(yīng)顯示,包括:
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李志功,肖熠,卜景德,
申請(專利權(quán))人:曙光信息產(chǎn)業(yè)北京有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。