System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請實施例涉及深度學習,尤其涉及一種調度信息的生成方法、裝置及相關設備。
技術介紹
1、隨著云用戶數量的激增和云計算資源規模的不斷擴大,任務資源調度已經成為了邊緣計算技術(mobile?edge?computing,mec)中的研究熱點。傳統的調度方案復雜度過高,處理任務和資源一旦過多,處理的速度越慢,任務調度存在很大的延遲,無法實時響應,并且對服務器資源種類考慮的比較少,容易造成其他重要資源的負載失衡,從而出現服務器資源調度效率較低的問題。
技術實現思路
1、本申請實施例提供一種調度信息的生成方法、裝置及相關設備,以解決現有技術中服務器資源調度效率較低的問題。
2、為解決上述問題,本申請是這樣實現的:
3、第一方面,本申請實施例提供了一種調度信息的生成方法,所述方法包括:
4、在多個候選服務器中匹配與待處理任務對應的目標服務器,所述目標服務器包括用于處理所述待處理任務的多個第一虛擬機;
5、根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡,所述第一深度學習網絡與所述目標服務器相匹配,所述第一深度學習網絡用于生成所述目標服務器處理所述待處理任務的調度策略;
6、將所述待處理任務輸入所述第二深度學習網絡中進行處理,生成目標調度策略,所述目標調度策略用于為所述待處理任務分配至少一個所述虛擬機。
7、可選的,所述根據所述目標服務器和第一深度學習
8、確定與所述目標服務器相匹配的初始深度學習網絡,所述初始深度學習網絡包括critic網絡和actor網絡;
9、初始化所述critic網絡的參數,以及初始化所述actor網絡的參數;
10、將訓練樣本數據輸入所述初始深度學習網絡進行識別,得到輸出值,所述訓練樣本數據包括多個樣本任務和訓練標簽,所述訓練標簽為處理所述多個樣本任務的調度策略;
11、使用損失函數計算所述輸出值與所述訓練標簽之間的損失,得到損失值;
12、基于所述損失值對所述critic網絡和所述actor網絡進行更新,得到所述第一深度學習網絡。
13、可選的,所述多個第一虛擬機的虛擬機類型包括k種類型,所述確定與所述目標服務器相匹配的初始深度學習網絡,包括:
14、根據所述目標服務器設定k*(n+2)矩陣,所述k*(n+2)矩陣的第一列用于記錄所述k種類型,所述k*(n+2)矩陣的第二列至第n列用于記錄所屬類型的虛擬機的標識,所述k*(n+2)矩陣的第n+1列用于記錄所屬類型的所有虛擬機的工作狀態,所述k*(n+2)矩陣的第n+2列用于記錄所屬類型的所有虛擬機的當前排隊任務信息,所述n為正整數,所述k為正整數;
15、基于所述k*(n+2)矩陣生成所述目標服務器的輸入表達式和輸出表達式,所述輸入表達式為所述目標服務器預分配處理任務的第一虛擬機的表達式,所述輸出表達式為所述目標服務器已處理任務的表達式;
16、根據所述輸入表達式和所述輸出表達式確定與所述目標服務器相匹配的初始深度學習網絡。
17、可選的,所述將訓練樣本數據輸入所述初始深度學習網絡進行識別,得到輸出值,包括:
18、將所述訓練樣本數據填入所述輸入表達式的第n+2列和所述輸出表達式的第二列,生成所述訓練樣本數據對應的目標輸入表達式和目標輸出表達式;
19、根據所述目標輸入表達式確定所述訓練樣本數據對應的高斯噪聲;
20、對所述目標輸入表達式進行特征提取,得到目標特征;
21、將所述目標特征和所述高斯噪聲輸入所述actor網絡進行識別,得到所述輸出值。
22、可選的,所述根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡:
23、根據所述目標服務器和第一深度學習網絡設定獎勵函數;
24、將所述獎勵函數、所述輸入表達式和所述輸出表達式放入所述第一深度學習網絡的經驗池中;
25、在所述第一深度學習網絡的經驗池已滿的情況下,使用梯度下降法對所述第一深度學習網絡進行迭代更新,得到所述第二深度學習網絡。
26、可選的,所述根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡,包括:
27、根據所述目標服務器的屬性信息和所述第一深度學習網絡的網絡結構設定目標函數;
28、基于所述目標函數設定所述獎勵函數;
29、基于所述目標函數和所述獎勵函數對所述第一深度學習網絡進行更新,得到所述第二深度學習網絡。
30、可選的,所述根據所述目標服務器的屬性信息和所述第一深度學習網絡的網絡結構設定目標函數,包括:
31、計算所述多個第一虛擬機的資源利用率,得到多個第一資源利用率,所述多個第一資源利用率與所述多個第一虛擬機一一對應;
32、計算將所述多個第一資源利用率的標準差,得到標準差;
33、計算所述多個第一虛擬機的負載情況,得到多個第一負載值,所述多個第一負載值與所述多個第一虛擬機一一對應;
34、計算所述多個第一負載值的平均值,得到平均負載值;
35、獲取所述目標服務器第t次調度后的服務質量和第t次調度后的能耗,所述t為正整數;
36、根據所述標準差、所述平均負載值、所述目標服務器第t次調度后的服務質量、所述目標服務器第t次調度后的能耗和所述第一深度學習網絡的網絡結構生成所述目標函數,所述目標函數用于約束所述目標服務器第t+1次的調度策略。
37、可選的,所述基于所述目標函數設定所述獎勵函數,包括:
38、獲取所述目標服務器的資源上限;
39、根據所述目標服務器的資源上限計算所述目標服務器中允許同時開啟的所述第一虛擬機的最大數量值;
40、根據所述目標函數獲取所述目標服務器第t次調度后的服務質量和第t次調度后的能耗;
41、根據所述目標服務器第t次調度后的服務質量、所述目標服務器第t次調度后的能耗和所述最大數量值生成所述獎勵函數,所述獎勵函數用于約束所述目標服務器第t+1次的調度策略。
42、第二方面,本申請實施例還提供一種調度信息的生成裝置,包括:
43、匹配模塊,用于在多個候選服務器中匹配與待處理任務對應的目標服務器,所述目標服務器包括用于處理所述待處理任務的多個第一虛擬機;
44、更新模塊,用于根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡,所述第一深度學習網絡與所述目標本文檔來自技高網...
【技術保護點】
1.一種調度信息的生成方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡之前,所述方法還包括:
3.根據權利要求2所述的方法,其特征在于,所述多個第一虛擬機的虛擬機類型包括K種類型,所述確定與所述目標服務器相匹配的初始深度學習網絡,包括:
4.根據權利要求3所述的方法,其特征在于,所述將訓練樣本數據輸入所述初始深度學習網絡進行識別,得到輸出值,包括:
5.根據權利要求3所述的方法,其特征在于,所述根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡:
6.根據權利要求1所述的方法,其特征在于,所述根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡,包括:
7.根據權利要求6所述的方法,其特征在于,所述根據所述目標服務器的屬性信
8.根據權利要求7所述的方法,其特征在于,所述基于所述目標函數設定所述獎勵函數,包括:
9.一種調度信息的生成裝置,其特征在于,所述裝置包括:
10.一種電子設備,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的程序;其特征在于,所述處理器,用于讀取存儲器中的程序實現如權利要求1至8中任一項所述的調度信息的生成方法中的步驟。
11.一種可讀存儲介質,用于存儲程序,其特征在于,所述程序被處理器執行時實現如權利要求1至8中任一項所述的調度信息的生成方法中的步驟。
12.一種計算機程序產品,其特征在于,所述計算機程序產品被存儲在存儲介質中,所述計算機程序產品被至少一個處理器執行以實現如權利要求1至8中任一項所述的調度信息的生成方法中的步驟。
...【技術特征摘要】
1.一種調度信息的生成方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡之前,所述方法還包括:
3.根據權利要求2所述的方法,其特征在于,所述多個第一虛擬機的虛擬機類型包括k種類型,所述確定與所述目標服務器相匹配的初始深度學習網絡,包括:
4.根據權利要求3所述的方法,其特征在于,所述將訓練樣本數據輸入所述初始深度學習網絡進行識別,得到輸出值,包括:
5.根據權利要求3所述的方法,其特征在于,所述根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到第二深度學習網絡:
6.根據權利要求1所述的方法,其特征在于,所述根據所述目標服務器和第一深度學習網絡設定獎勵函數,并基于所述獎勵函數對所述第一深度學習網絡進行更新,得到...
【專利技術屬性】
技術研發人員:劉錦濤,陳錦華,
申請(專利權)人:中移蘇州軟件技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。