System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲成a人片在线观看无码,无码国模国产在线无码精品国产自在久国产,精品一区二区无码AV
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>之江實驗室專利>正文

    一種深度學習加速器軟硬件協同方法及裝置制造方法及圖紙

    技術編號:44038702 閱讀:4 留言:0更新日期:2025-01-15 01:16
    本說明書公開了一種深度學習加速器軟硬件協同方法及裝置,在此方法中,通過軟件優化器基于初始硬件參數配置樣本,確定候選模型運行信息后,通過硬件優化器,基于候選模型運行信息對應的任務效率表征值,確定下輪迭代的初始硬件參數配置樣本,若監測到到達預設輪次后前后兩輪所對應的初始硬件參數配置樣本對應的任務效率表征值之間的偏差小于預設偏差,則將滿足預設迭代條件時得到的初始硬件參數配置樣本,作為目標硬件參數配置,以及將軟件優化器基于目標硬件參數配置所確定的候選模型運行信息對應的候選模型運行方式,作為目標模型運行方式。通過多輪迭代對軟件和硬件不斷進行協同配置,以實現針對給定模型集合的最優加速器規格參數。

    【技術實現步驟摘要】

    本說明書涉及計算機和人工智能領域,尤其涉及一種深度學習加速器軟硬件協同方法及裝置


    技術介紹

    1、深度學習加速器是一種專門設計用于加速深度學習計算的硬件,隨著深度學習技術的快速發展,處理大量數據和復雜模型所需的計算量也在不斷增加,因此,深度學習加速器在提升計算性能和計算效率方面有重要的作用。

    2、而深度學習加速器是ai芯片的一種類型,用于加速深度學習和人工智能任務中的計算過程。

    3、以當前來看,在人工智能(artificial?intelligence,ai)芯片設計方面,通常采用軟硬件融合的設計方法,來充分利用ai模型的計算特性和訪存特性,以實現更高效的計算以及更好的性能。

    4、在ai芯片設計中,需要仔細配置計算、存儲和通信等硬件資源,還要確保ai模型在芯片上進行運行時,有良好的性能和快速的計算速度,所以,目前需要對模型進行部署時,從硬件和軟件層面上設計出相應的部署方案,但目前模型的部署方案策略,并不能有效提高模型的運行速度以及性能。

    5、另外,多模型同步運行,ai?算法在單個任務(例如手部跟蹤、深度估計、語音識別)中的成功導致了多模型?ai?工作負載的出現。ai加速器高效設計,為了滿足現代?ai?工作負載不斷增長的計算需求與不斷變化的應用需求,需要高效的專用芯片設計方法。

    6、面對以上難題,如何更加準確地進行模型的部署,則是一個亟待解決的問題。


    技術實現思路

    1、本說明書實施例提供一種深度學習加速器軟硬件協同方法及裝置,以部分解決上述現有技術存在的問題。

    2、本說明書實施例采用下述技術方案:

    3、本說明書提供的一種深度學習加速器軟硬件協同方法,包括:

    4、獲取目標模型的模型參數以及加速器面積約束,所述加速器面積約束用于表征加速器分配給目標模型的硬件配置預算;

    5、根據所述加速器面積約束中所包含的硬件參數配置,確定出初始硬件參數配置樣本;

    6、將所述初始硬件參數配置樣本對應的硬件參數以及所述模型參數輸入到預設的軟件優化器中,以使所述軟件優化器在給定所述初始硬件參數配置樣本對應的硬件運行環境下,確定各初始模型運行信息,并基于所述各初始模型運行信息,確定候選模型運行信息;

    7、將所述候選模型運行信息輸入到預設的分析模型中,以通過所述分析模型,預測按照所述候選模型運行信息對應的候選模型運行方式在所述初始硬件參數配置樣本對應的硬件運行環境下執行所述目標模型的運算任務時所得到的任務效率表征值,根據所述候選模型運行方式對應的任務效率表征值,確定在給定所述候選模型運行方式的條件下,下輪迭代的初始硬件參數配置樣本,以將所述下輪迭代的初始硬件參數配置樣本發送給所述軟件優化器,以使所述軟件優化器根據所述下輪迭代的初始硬件參數配置樣本以及所述模型參數,確定出下輪迭代所對應的候選模型運行方式,直到滿足預設的迭代條件為止,得到目標模型運行方式以及目標硬件參數配置;

    8、在目標設備上配置所述目標硬件參數配置對應的目標硬件運行環境,并基于所述目標硬件運行環境,在所述目標設備上部署所述目標模型,以按照所述目標模型運行方式,在所述目標設備上執行所述目標模型對應的運算任務。

    9、可選地,基于所述各初始模型運行信息,確定候選模型運行信息,具體包括:

    10、從所述各初始模型運行信息中進行抽樣,得到抽樣模型運行信息;

    11、將所述抽樣模型運行信息以及所述初始硬件參數配置樣本輸入到預設的評估器中,以通過所述評估器,預測按照所述抽樣模型運行信息在所述初始硬件參數配置樣本對應的硬件運行環境下執行所述目標模型的運算任務時所得到的任務效率表征值,作為抽樣表征值;

    12、將所述抽樣表征值、所述抽樣模型運行信息以及所述初始硬件參數配置樣本輸入到所述軟件優化器中,以在所述初始硬件參數配置樣本對應的硬件運行環境下,通過所述軟件優化器對所述抽樣表征值以及所述抽樣模型運行信息進行擬合,得到第一優化模型;

    13、通過所述第一優化模型,基于所述各初始模型運行信息,確定候選模型運行信息。

    14、可選地,根據所述候選模型運行方式對應的任務效率表征值,確定在給定所述候選模型運行方式的條件下,下輪迭代的初始硬件參數配置樣本,具體包括:

    15、將所述候選模型運行方式對應的任務效率表征值、所述候選模型運行方式以及所述初始硬件參數配置樣本輸入到預設的硬件優化器中,以通過所述硬件優化器,確定在給定所述候選模型運行方式的條件下,下輪迭代的初始硬件參數配置樣本。

    16、可選地,通過所述硬件優化器,確定在給定所述候選模型運行方式的條件下,下輪迭代的初始硬件參數配置樣本,具體包括:

    17、基于所述候選模型運行方式,通過所述硬件優化器對所述候選模型運行方式對應的任務效率表征值以及所述初始硬件參數配置樣本進行擬合,得到第二優化模型;

    18、基于所述目標模型執行任務時所需的各硬件參數配置,通過所述第二優化模型,確定在給定所述候選模型運行方式的條件下各基礎硬件參數配置樣本;

    19、將所述各基礎硬件參數配置樣本輸入到預設的評估器中,以通過所述評估器,預測按照所述各基礎硬件參數配置樣本對應的硬件運行環境下執行所述目標模型的運算任務時所得到的任務效率表征值,作為每個基礎硬件參數配置樣本對應的任務效率表征值;

    20、根據每個基礎硬件參數配置樣本對應的任務效率表征值,確定下輪迭代的初始硬件參數配置樣本。

    21、可選地,直到滿足預設的迭代條件為止,得到目標模型運行方式以及目標硬件參數配置,具體包括;

    22、若監測到到達預設輪次后前后兩輪所對應的初始硬件參數配置樣本對應的任務效率表征值之間的偏差小于預設偏差,則確定滿足預設的迭代條件,并將預設的迭代條件時所得到的初始硬件參數配置樣本,作為目標硬件參數配置,以及將所述軟件優化器基于所述目標硬件參數配置所確定的候選模型運行方式,作為目標模型運行方式。

    23、可選地,目標模型包括至少一個用于執行運算任務的模型。

    24、本說明書提供的一種深度學習加速器軟硬件協同裝置,包括:

    25、獲取模塊,用于獲取目標模型的模型參數以及加速器面積約束,所述加速器面積約束用于表征加速器分配給目標模型的硬件配置預算;

    26、第一確定模塊,用于根據所述加速器面積約束中所包含的硬件參數配置,確定出初始硬件參數配置樣本;

    27、第二確定模塊,用于將所述初始硬件參數配置樣本對應的硬件參數以及所述模型參數輸入到預設的軟件優化器中,以使所述軟件優化器在給定所述初始硬件參數配置策略對應的硬件運行環境下,確定各初始模型運行信息,并基于所述各初始模型運行信息,確定候選模型運行信息;

    28、分析模塊,用于將所述候選模型運行信息輸入到預設的分析模型中,以通過所述分析模型,預測按照所述候選模型運行信息對應的候選模型運行方式在所述初始硬件參數配置本文檔來自技高網...

    【技術保護點】

    1.一種深度學習加速器軟硬件協同方法,其特征在于,包括:

    2.如權利要求1所述的方法,其特征在于,基于所述各初始模型運行信息,確定候選模型運行信息,具體包括:

    3.如權利要求1所述的方法,其特征在于,根據所述候選模型運行方式對應的任務效率表征值,確定在給定所述候選模型運行方式的條件下,下輪迭代的初始硬件參數配置樣本,具體包括:

    4.如權利要求3所述的方法,其特征在于,通過所述硬件優化器,確定在給定所述候選模型運行方式的條件下,下輪迭代的初始硬件參數配置樣本,具體包括:

    5.如權利要求1所述的方法,其特征在于,直到滿足預設的迭代條件為止,得到目標模型運行方式以及目標硬件參數配置,具體包括:

    6.如權利要求1~5任一項所述的方法,其特征在于,目標模型包括至少一個用于執行運算任務的模型。

    7.一種深度學習加速器軟硬件協同裝置,其特征在于,包括:

    8.如權利要求7所述的裝置,其特征在于,所述第二確定模塊具體用于,從所述各初始模型運行信息中進行抽樣,得到抽樣模型運行信息;將所述抽樣模型運行信息以及所述初始硬件參數配置樣本輸入到預設的評估器中,以通過所述評估器,預測按照所述抽樣模型運行信息在所述初始硬件參數配置樣本對應的硬件運行環境下執行所述目標模型的運算任務時所得到的任務效率表征值,作為抽樣表征值;將所述抽樣表征值、所述抽樣模型運行信息以及所述初始硬件參數配置樣本輸入到所述軟件優化器中,以在所述初始硬件參數配置樣本對應的硬件運行環境下,通過所述軟件優化器對所述抽樣表征值以及所述抽樣模型運行信息進行擬合,得到第一優化模型;通過所述第一優化模型,基于所述各初始模型運行信息,確定候選模型運行信息。

    9.一種計算機可讀存儲介質,其特征在于,所述存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述權利要求1-6?任一項所述的方法。

    10.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現上述權利要求1-6?任一項所述的方法。

    ...

    【技術特征摘要】

    1.一種深度學習加速器軟硬件協同方法,其特征在于,包括:

    2.如權利要求1所述的方法,其特征在于,基于所述各初始模型運行信息,確定候選模型運行信息,具體包括:

    3.如權利要求1所述的方法,其特征在于,根據所述候選模型運行方式對應的任務效率表征值,確定在給定所述候選模型運行方式的條件下,下輪迭代的初始硬件參數配置樣本,具體包括:

    4.如權利要求3所述的方法,其特征在于,通過所述硬件優化器,確定在給定所述候選模型運行方式的條件下,下輪迭代的初始硬件參數配置樣本,具體包括:

    5.如權利要求1所述的方法,其特征在于,直到滿足預設的迭代條件為止,得到目標模型運行方式以及目標硬件參數配置,具體包括:

    6.如權利要求1~5任一項所述的方法,其特征在于,目標模型包括至少一個用于執行運算任務的模型。

    7.一種深度學習加速器軟硬件協同裝置,其特征在于,包括:

    8.如權利要求7所述的裝置,其特征在于,所述第二確定模塊具體用于,從所述各初...

    【專利技術屬性】
    技術研發人員:侯瑞崢程穩崔鈺劉懿呂波曾令仿
    申請(專利權)人:之江實驗室
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码任你躁久久久久久久| 国产精品亚洲专区无码不卡| 亚洲a∨无码一区二区| 免费看国产成年无码AV片| 无码专区—VA亚洲V天堂| 成人毛片无码一区二区| 无码精品久久久久久人妻中字| 亚洲av永久无码制服河南实里| 亚洲国产AV无码一区二区三区| 中文精品无码中文字幕无码专区| 久久久久无码精品国产不卡| 亚洲AV无码AV男人的天堂| 国产精品成人无码免费| 久久中文精品无码中文字幕| 色欲A∨无码蜜臀AV免费播| 久久久久亚洲AV无码网站| 亚洲美日韩Av中文字幕无码久久久妻妇| 无套内射在线无码播放| 内射精品无码中文字幕| 国产AV无码专区亚洲A∨毛片| 亚洲乱人伦中文字幕无码| 亚洲成AV人片在线播放无码| 亚洲AV无码久久精品蜜桃| 亚洲av日韩av高潮潮喷无码| 久久午夜夜伦鲁鲁片免费无码| 性色av无码不卡中文字幕| 精品多人p群无码| 日韩加勒比一本无码精品| 亚洲AV无码一区二区三区久久精品| 人妻少妇无码精品视频区| 无码av无码天堂资源网| 久久久久亚洲AV成人无码网站| 国产99久久九九精品无码| 国产人成无码视频在线观看| 亚洲国产成人无码av在线播放| 免费无码专区毛片高潮喷水| 6080YYY午夜理论片中无码| 亚洲熟妇少妇任你躁在线观看无码| 日韩精品无码专区免费播放| 亚洲中文无码线在线观看| 国产白丝无码免费视频|