System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 人妻丰满熟妇aⅴ无码,国产V亚洲V天堂无码久久久,天码av无码一区二区三区四区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種算力卡超分和優先級調度方法、系統、電子設備及存儲介質技術方案

    技術編號:43288448 閱讀:13 留言:0更新日期:2024-11-12 16:09
    本發明專利技術公開了一種算力卡超分和優先級調度方法、系統、電子設備及存儲介質,包括將單個物理GPU劃分為多個邏輯上的GPU實例,預先設置單個物理GPU超分數和每個邏輯上的GPU實例的核心數限制、顯存限制;將超分數、核心數限制和顯存限制注冊到節點的Kubernetes上;Kubernetes的調度器在調度過程中識別Pod對超分數、核心數限制和顯存限制的聲明,實現不同的調度策略;調度策略包括Binpack策略和Spread策略,Binpack策略則為選擇分數最高進行調度,Spread策略則為選擇分數最低進行調度。本發明專利技術有效降低碎卡率,通過精細的調度策略和GPU資源的超分技術,能夠更合理地分配和管理GPU資源,減少因資源分配不當而導致的GPU碎片,提高資源利用效率和系統性能。

    【技術實現步驟摘要】

    本專利技術涉及調度,尤其涉及一種算力卡超分和優先級調度方法、系統、電子設備及存儲介質


    技術介紹

    1、在ai大模型快速崛起的時代背景下,無論是大模型的訓練還是運行實時推理任務,都高度依賴于圖形處理單元(gpu)的強大計算能力。gpu以其并行處理架構在加速大規模矩陣運算和神經網絡計算方面展現出了卓越的性能,成為支撐ai發展的關鍵技術之一。對于機器學習平臺而言,如何高效管理和利用gpu資源,提升資源利用率,成為了一個至關重要的挑戰。

    2、kubernetes?作為云原生領域的事實標準,通過其強大的容器編排和集群管理能力,為提升gpu使用效率提供了有力支持。kubernetes?能夠基于資源的請求和限制自動調度容器到合適的節點上,通過精細的資源配置策略,如cpu、內存以及gpu的數量和類型,可以確保任務得到足夠的資源,同時避免資源浪費。此外,kubernetes?調度器可以支持基于gpu類型的親和性和反親和性調度,使得特定類型的任務能夠運行在特定的gpu硬件上,優化資源使用效率。為了最大化gpu資源的使用率,kubernetes?支持通過特定的設備插件(如nvidia?device?plugin)實現gpu的共享。這些插件允許多個容器或pod共享同一個gpu,通過虛擬化技術或時間片輪轉機制來分配gpu,從而顯著提高資源利用率。同時,kubernetes還提供了資源隔離機制,確保不同工作負載之間的互不干擾,保證任務的穩定性和安全性。

    3、主流的?gpu?共享調度方案旨在提高?gpu?資源的利用率和調度公平性。為了達到這個目的,這些方案通常采用資源隔離和調度算法等技術手段。資源隔離是一種常見的技術手段,將?gpu?設備分割成多個虛擬?gpu,每個虛擬?gpu?可以被分配給一個容器使用。不同容器中的任務可以在獨立的虛擬?gpu?上執行,提高?gpu?資源的利用率。除了資源隔離,調度算法也是?gpu?共享調度的核心技術之一。調度算法可以根據任務的不同特征和優先級,合理地分配?gpu?資源,從而保證?gpu?調度的公平性和高效性。常見的調度算法包括基于權重的調度算法、基于隊列的調度算法等。

    4、盡管當前的gpu共享調度方案為高性能算力卡提供了靈活的切分能力,使得多個容器或任務能夠共享同一塊gpu的資源,從而提高了資源利用率和成本效益。然而,這種共享機制也伴隨著一個顯著的問題——碎卡問題。碎卡問題主要指的是在gpu被多個任務共享時,由于每個任務對gpu資源的需求不同,且這些需求往往難以精確預測和匹配,導致gpu資源被分割成多個碎片化資源。這些碎片化的資源可能無法被有效利用,因為它們的大小可能不滿足后續任務的需求,或者由于管理上的復雜性而難以重新組合。


    技術實現思路

    1、針對上述問題中存在的不足之處,本專利技術提供一種算力卡超分和優先級調度方法、系統、電子設備及存儲介質。

    2、為實現上述目的,本專利技術提供一種算力卡超分和優先級調度方法,包括:

    3、將單個物理gpu劃分為多個邏輯上的gpu實例,預先設置所述單個物理gpu超分數和每個邏輯上的所述gpu實例的核心數限制、顯存限制;

    4、將所述超分數、所述核心數限制和所述顯存限制注冊到節點的kubernetes上;

    5、所述kubernetes的調度器在調度過程中識別pod對所述超分數、所述核心數限制和所述顯存限制的聲明,實現不同的調度策略;

    6、所述調度策略包括binpack策略和spread策略,所述binpack策略則為選擇分數最高進行調度,所述spread策略則為選擇分數最低進行調度。

    7、優選的是,對節點進行打分公式為:

    8、;

    9、式中:表示當前調度pod需要使用的物理gpu個數,表示當前節點已經使用的物理gpu個數,表示當前節點的可用gpu個數,表示權重。

    10、優選的是,當單個所述pod經過調度器時,獲取所述pod使用卡數、使用顯存和使用核心。

    11、優選的是,基于所述pod使用卡數、使用顯存和使用核心,從三個維度進行打分,打分公式為:

    12、;

    13、;

    14、。

    15、優選的是,超分維度和顯存維度的默認權重設為?0.4,算力維度的默認權重設為0.2,默認為10,最終得分的計算公式為:

    16、。

    17、本申請還提供一種算力卡超分和優先級調度系統,包括:

    18、劃分模塊,用于將單個物理gpu劃分為多個邏輯上的gpu實例,預先設置所述單個物理gpu超分數和每個邏輯上的所述gpu實例的核心數限制、顯存限制;

    19、注冊模塊,用于將所述超分數、所述核心數限制和所述顯存限制注冊到節點的kubernetes上;

    20、調度模塊,用于所述kubernetes的調度器在調度過程中識別pod對所述超分數、所述核心數限制和所述顯存限制的聲明,實現不同的調度策略;

    21、策略模塊,用于所述調度策略包括binpack策略和spread策略,所述binpack策略則為選擇分數最高進行調度,所述spread策略則為選擇分數最低進行調度。

    22、本專利技術還提供一種電子設備,包括至少一個處理單元以及至少一個存儲單元,其中,所述存儲單元存儲有計算機程序,當所述程序被所述處理單元執行時,使得所述處理單元執行上述的方法。

    23、本專利技術還提供一種存儲介質,其存儲有可由電子電子設備執行的計算機程序,當所述程序在所述電子電子設備上運行時,使得所述電子電子設備執行上述的方法。

    24、與現有技術相比,本專利技術的有益效果為:

    25、本專利技術有效降低碎卡率,通過精細的調度策略和gpu資源的超分技術,能夠更合理地分配和管理gpu資源,減少因資源分配不當而導致的gpu碎片,提高資源利用效率和系統性能。

    本文檔來自技高網...

    【技術保護點】

    1.一種算力卡超分和優先級調度方法,其特征在于,包括:

    2.根據權利要求1所述的算力卡超分和優先級調度方法,其特征在于,對節點進行打分公式為:

    3.根據權利要求2所述的算力卡超分和優先級調度方法,其特征在于,當單個所述Pod經過調度器時,獲取所述Pod使用卡數、使用顯存和使用核心。

    4.根據權利要求3所述的算力卡超分和優先級調度方法,其特征在于,基于所述Pod使用卡數、使用顯存和使用核心,從三個維度進行打分,打分公式為:

    5.根據權利要求4所述的算力卡超分和優先級調度方法,其特征在于,超分維度和顯存維度的默認權重設為?0.4,算力維度的默認權重設為?0.2,默認為10,最終得分的計算公式為:

    6.一種算力卡超分和優先級調度系統,其特征在于,包括:

    7.一種電子設備,其特征在于,包括至少一個處理單元以及至少一個存儲單元,其中,所述存儲單元存儲有計算機程序,當所述程序被所述處理單元執行時,使得所述處理單元執行權利要求1~5任一權利要求所述的方法。

    8.一種存儲介質,其特征在于,其存儲有可由電子電子設備執行的計算機程序,當所述程序在所述電子電子設備上運行時,使得所述電子電子設備執行權利要求1~5任一權利要求所述的方法。

    ...

    【技術特征摘要】

    1.一種算力卡超分和優先級調度方法,其特征在于,包括:

    2.根據權利要求1所述的算力卡超分和優先級調度方法,其特征在于,對節點進行打分公式為:

    3.根據權利要求2所述的算力卡超分和優先級調度方法,其特征在于,當單個所述pod經過調度器時,獲取所述pod使用卡數、使用顯存和使用核心。

    4.根據權利要求3所述的算力卡超分和優先級調度方法,其特征在于,基于所述pod使用卡數、使用顯存和使用核心,從三個維度進行打分,打分公式為:

    5.根據權利要求4所述的算力卡超分和優先級調度方法,其特征在于,超分維度和顯存維度...

    【專利技術屬性】
    技術研發人員:谷嘉樂王翱宇王羽中陳雪兒蔣咪司云起
    申請(專利權)人:杭州諧云科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文字幕无码视频手机免费看 | 亚洲AV成人无码天堂| 国产精品成人一区无码| 一本大道久久东京热无码AV| 伊人久久无码中文字幕| 亚洲AV无码一区二区三区久久精品| 日韩乱码人妻无码中文视频| 日韩网红少妇无码视频香港| 国产精品无码DVD在线观看| 色窝窝无码一区二区三区 | 中出人妻中文字幕无码| 91久久精品无码一区二区毛片 | 无码精品国产va在线观看dvd| 国产精品va在线观看无码| 无码人妻精品一区二区三区东京热 | 国产成人精品一区二区三区无码| 亚洲人片在线观看天堂无码| 国产亚洲人成无码网在线观看| 免费无码肉片在线观看| 无码午夜成人1000部免费视频 | 日韩免费无码一区二区视频| 亚洲精品偷拍无码不卡av| 中文无码久久精品| 亚洲精品无码av天堂| 久久国产精品成人无码网站| 无码国产精成人午夜视频不卡| 精品无码久久久久久尤物| 久久久久无码精品亚洲日韩 | 精品国产aⅴ无码一区二区| 亚洲精品无码专区久久久| 黄A无码片内射无码视频| 亚洲免费无码在线| HEYZO无码综合国产精品227| 日韩成人无码影院| 国产精品成人无码久久久久久 | 国产精品99无码一区二区| 无码精品蜜桃一区二区三区WW| 国产莉萝无码AV在线播放| 无码中文在线二区免费| 无码视频一区二区三区| 精品无码成人网站久久久久久|