The invention discloses a computer cluster scheduling method, including the basis of each untreated task types and each type of task average resource occupancy rate to determine the various preset processing tasks without resource utilization; in accordance with the resource occupancy rate size for each untreated task processing task distribution corresponding to the size of the container process. The size of container can be adjusted according to the resources required by the task, and the waste of resources can be avoided as much as possible, and the utilization efficiency of the running resource can be improved. The invention also discloses a computer cluster job scheduling device adopting the above method, and also has the advantages that no longer details.
【技術實現步驟摘要】
一種計算機集群作業調度方法及其裝置
本專利技術涉及作業調度領域,特別是涉及一種計算機集群作業調度方法及其裝置。
技術介紹
Hadoop是一種能在大規模計算機集群上運行大數據處理應用的開源框架,作業調度是Hadoop系統的一個重要組成部分。在作業調度過程中,調度基本單元為container,每個任務對應一個container,container的大小(一般為內存大小)為固定的,當任務過大時,會將任務分割為幾個小任務后由幾個container執行,但對于較小的任務而言,一般用不了container所包含的全部資源,即較小的任務所需的內存等資源較少,而這些小任務也由一個container來完成的話,會造成資源的浪費。因此,如何提供一種節約資源的計算機集群作業調度方法及其裝置是本領域技術人員目前需要解決的問題。
技術實現思路
本專利技術的目的是提供一種計算機集群作業調度方法及其裝置,能夠根據任務所需的資源調整container的大小,盡可能避免資源的浪費,提高運行資源的利用效率。為解決上述技術問題,本專利技術提供了一種計算機集群作業調度方法,包括:步驟s101:依據各個未處理任務的任務類型以及預設的每種任務類型的平均資源占用率確定各個所述未處理任務的資源占用率;步驟s102:按照所述資源占用率的大小,分別為各個所述未處理任務分配相應大小的container進程進行任務處理。優選地,步驟s101與步驟s102之間還包括:依據各個所述未處理任務的任務類型、預設的每種任務類型單位數據量的平均占用時間以及對應的資源占用率確定各個所述未處理任務的資源占用量;周期性檢測所述集群的 ...
【技術保護點】
一種計算機集群作業調度方法,其特征在于,包括:步驟s101:依據各個未處理任務的任務類型以及預設的每種任務類型的平均資源占用率確定各個所述未處理任務的資源占用率;步驟s102:按照所述資源占用率的大小,分別為各個所述未處理任務分配相應大小的container進程進行任務處理。
【技術特征摘要】
1.一種計算機集群作業調度方法,其特征在于,包括:步驟s101:依據各個未處理任務的任務類型以及預設的每種任務類型的平均資源占用率確定各個所述未處理任務的資源占用率;步驟s102:按照所述資源占用率的大小,分別為各個所述未處理任務分配相應大小的container進程進行任務處理。2.根據權利要求1所述的方法,其特征在于,步驟s101與步驟s102之間還包括:依據各個所述未處理任務的任務類型、預設的每種任務類型單位數據量的平均占用時間以及對應的資源占用率確定各個所述未處理任務的資源占用量;周期性檢測所述集群的空閑資源占用率;從當前的各個所述未處理任務中,篩選出資源占用率未超出所述空閑資源占用率的未處理任務作為候選任務,并將各個所述候選任務按照資源占用量從小到大的順序加入候選任務列表;其中,所述候選任務列表中的任務處理順序為任務排列順序。3.根據權利要求2所述的方法,其特征在于,所述依據各個所述未處理任務的任務類型、預設的每種任務類型單位數據量的平均占用時間以及對應的資源占用率確定各個所述未處理任務的資源占用量的過程具體為:依據各個所述未處理任務的任務類型以及預設的每種任務類型單位數據量的平均占用時間,確定每個所述未處理任務的單位數據量的平均占用時間;確定每個所述未處理任務的輸入數據量;分別將每個所述未處理任務的所述輸入數據量與自身的單位數據量的平均占用時間相乘,得到每個所述未處理任務的占用時間;將每個所述未處理任務的占用時間與自身的資源占用率相乘,得到每個所述未處理任務的資源占用量。4.根據權利要求2所述的方法,其特征在于,將各個所述候選任務加入所述候選任務列表后,還包括:將篩選出的資源占用率超出所述空閑資源占用率的若干個未處理任務按照...
【專利技術屬性】
技術研發人員:辛永欣,
申請(專利權)人:鄭州云海信息技術有限公司,
類型:發明
國別省市:河南,41
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。