System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于信息,涉及網絡管理技術,具體是一種數據中心的智能化運維管理系統及方法。
技術介紹
1、數據中心作為信息技術的核心樞紐,匯聚了海量的硬件資源,包括高性能服務器、大容量存儲設備以及復雜的網絡設備,共同支撐著數據的存儲、處理與傳輸。為了高效管理和最大化利用這些資源,數據中心智能化運維管理系統應運而生,其核心在于通過集成先進的it運維工具、自動化流程、大數據分析以及機器學習技術,實現運維工作的全面智能化、自動化與高效化。數據中心智能化運維的關鍵在于其不僅需要具備實時監控的能力,還需要能夠精確捕捉數據中心網絡環境的每一個細微變化,包括cpu負載、內存利用率、磁盤i/o性能以及網絡帶寬使用情況等關鍵指標,而且能夠基于這些數據進行深度分析,為運維人員提供精準的決策支持,確保數據中心運維工作的高效與精準。
2、在公開號為cn116170296b的專利技術專利中申請了“一種網絡自動運維管理系統以及方法”,該系統及方法通過獲取網絡節點狀態信息并檢測其是否有缺失,來判斷相關網絡設備是否電源故障,若存在電源故障,再判斷相關聯的其他網絡設備運行信息是否缺失,以此建立通信檢測通道排查故障,實現了網絡節點異常時的自動化故障節點定位。
3、在公開號為cn118509743a的專利技術專利中申請了“一種智能化網絡運維管理系統”,該系統通過數據采集模塊采集網絡設備、服務器和數據庫性能參數,將數據輸送到數據分析模塊進行分析處理;若配電輸送柜體出現溫度異常,則通過應急處理模塊(包括溫度監測輔助模塊、控制模塊、控制閥、冷卻管與線纜限
4、現有的智能化運維管理系統主要側重于通過檢查電源狀態或監測溫度異常來定位故障。然而,數據中心可能出現的故障類型多種多樣,諸如硬件老化、軟件錯誤、配置失誤、網絡攻擊等其他故障類型。例如,硬件老化可能導致服務器性能逐漸下降,會存在如硬盤的讀寫速度長期緩慢降低、內存芯片的潛在錯誤率上升等問題,如果僅依靠檢查電源狀態和監測溫度異常是無法被發現的。并且,電源故障或溫度異常通常是在故障已經發生并發展到一定程度后才會被檢測到,導致系統在故障處理的時效性上存在嚴重不足,增加了故障對數據中心業務的影響時間和破壞程度。
5、同時,盡管運維管理系統已經實現了部分自動化功能,但在實際操作中,仍然存在大量的手動操作環節。例如,設備的日常巡檢、一些簡單故障的處理、配置更改的審批等。這些手動操作不僅效率低下,而且容易出現人為錯誤。特別是在數據中心規模較大、設備數量眾多的情況下,手動操作的工作量巨大,增加了運維人員的工作負擔和出錯的概率。
技術實現思路
1、本專利技術旨在至少解決現有技術中存在的技術問題之一;為此,本專利技術提出了一種數據中心的智能化運維管理系統及方法,用于解決現有網絡運維管理系統中故障預判能力不足、智能化和自動化程度不夠的技術問題。
2、為實現上述目的,本專利技術的第一方面提供了一種數據中心的智能化運維管理系統,包括:數據采集模塊、資源配置模塊、故障預測模塊和故障定位模塊;
3、數據采集模塊:用于從數據中心采集網絡拓撲結構、性能數據、電力供應數據以及設備狀態數據;
4、資源配置模塊:用于根據網絡拓撲結構將網絡劃分為若干子區域;以及,根據若干子區域的性能數據和電力供應數據進行重要程度排序,并根據重要程度為若干子區域進行網絡資源配置;
5、故障預測模塊:用于利用故障預測模型對若干子區域進行故障預測,得到預測故障子區域和預測故障類型;其中,所述故障預測模型基于深度學習算法構建,并部署在數據中心;
6、故障定位模塊:用于根據預測故障子區域和預測故障類型定位預測故障節點,并對預測故障節點進行預警操作。
7、基于上述技術模塊,本專利技術實現了對數據中心的智能化運維管理,包括對網絡狀態的全面感知、資源的高效利用、故障的提前預警和快速定位,從而保障了數據中心的穩定運行,提高了運維效率,降低了因故障導致的業務中斷風險和企業運營成本。
8、進一步地,所述根據網絡拓撲結構將網絡劃分為若干子區域,包括:
9、a1,將網絡拓撲結構中的設備表示為節點、設備之間的連接鏈路表示為邊,得到圖數據結構;
10、a2,獲取網絡拓撲結構中相連設備間的跳數距離,并根據跳數距離設置圖數據結構中的模塊度函數;其中,跳數距離通過traceroute工具測量獲得;
11、a3,根據模塊度函數基于聚類算法對圖數據結構進行聚類操作,將網絡劃分為若干個子區域。
12、通過將網絡劃分為若干子區域,能夠更清晰地了解不同區域的資源需求和使用情況,并且可以根據各子區域的業務特點、重要程度等因素,有針對性地進行網絡資源的分配,確保資源合理利用,提高資源分配的效率,避免資源的浪費。
13、進一步地,所述根據跳數距離設置圖數據結構中的模塊度函數,包括:
14、a2-1,根據設備之間的連接鏈路得到圖數據結構中的邊權重為:其中,wij表示節點i、j之間的邊權重,bij表示節點i、j之間連接鏈路的帶寬,uij表示節點i、j之間連接鏈路的利用率,rij表示節點i、j之間連接鏈路的可靠性,通過歷史故障數據統計獲得,αi(i=1,2,3)表示權重系數,且和為1;
15、a2-2,根據相連設備間的跳數距離得到圖數據結構中的距離權重為:其中,dij表示節點i、j之間的距離權重,hij表示節點i、j之間的跳數距離;
16、a2-3,基于邊權重和距離權重得到模塊度函數為:其中,c表示劃分的子區域。
17、在設置模塊度函數時,不僅考慮了設備之間連接鏈路的帶寬、利用率等常規因素,還結合了通過歷史故障數據統計獲得的連接鏈路的可靠性因素,以及相連設備間的跳數距離因素。這樣綜合多方面因素來確定模塊度函數,使得劃分子區域的依據更加全面、客觀,能夠更精準地根據網絡的實際狀況,進行劃分,避免了單一因素導致的劃分不合理問題。
18、進一步地,所述根據模塊度函數基于聚類算法對圖數據結構進行聚類操作,包括:
19、a3-1,將圖數據結構中的所有節點初始化為各自獨立的子區域,且每個子區域的初始模塊度值為0;
20、a3-2,對于圖數據結構中的每一個節點i,根據模塊度函數計算得到節點i移動到鄰居節點j后的模塊度變化值;
21、a3-3,判斷模塊度變化值是否大于0;是,則將節點i移動到鄰居節點j所在的子區域;否,則保持節點i所在的子區域不變;
22、a3-4,重復a3-2和a3-3,直至所有節點的子區域歸屬不再發生變化,得到若干子區域。
23、采用基于模塊度函數的聚類算法進行子區域劃分,通過不斷計算節點移動到鄰居節點后的模塊度變化值,并根據該變化值來動態調整節點的子區域歸屬,直至所有節點的子區域歸屬不再發生變化。這種動態聚類的方式具有較高的靈活性,能夠根據網絡的實時狀態,如設備的增減、鏈路的變化等,自動調整子本文檔來自技高網...
【技術保護點】
1.一種數據中心的智能化運維管理系統,其特征在于,包括:
2.根據權利要求1所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據網絡拓撲結構將網絡劃分為若干子區域,包括:
3.根據權利要求2所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據跳數距離設置圖數據結構中的模塊度函數,包括:
4.根據權利要求2所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據模塊度函數基于聚類算法對圖數據結構進行聚類操作,包括:
5.根據權利要求1所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據若干子區域的性能數據和電力供應數據進行重要程度排序,包括:
6.根據權利要求5所述的一種數據中心的智能化運維管理系統,其特征在于,所述標準化公式為其中,xnm表示第n個子區域的第m個正向指標,ynm表示第n個子區域的第m個負向指標,與表示標準化后的指標數據。
7.根據權利要求1所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據重要程度為若干子區域進行網絡資源配置,包括:
8.根據權
9.根據權利要求1所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據預測故障子區域和預測故障類型定位預測故障節點,包括:
10.一種數據中心的智能化運維管理方法,應用于權利要求1-9中任一項所述的一種數據中心的智能化運維管理系統,其特征在于,包括:
...【技術特征摘要】
1.一種數據中心的智能化運維管理系統,其特征在于,包括:
2.根據權利要求1所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據網絡拓撲結構將網絡劃分為若干子區域,包括:
3.根據權利要求2所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據跳數距離設置圖數據結構中的模塊度函數,包括:
4.根據權利要求2所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據模塊度函數基于聚類算法對圖數據結構進行聚類操作,包括:
5.根據權利要求1所述的一種數據中心的智能化運維管理系統,其特征在于,所述根據若干子區域的性能數據和電力供應數據進行重要程度排序,包括:
6.根據權利要求5所述的一種數據中心的智能化運維管理系統...
【專利技術屬性】
技術研發人員:王強,錢磊,丁勝飛,張俊,陶永強,
申請(專利權)人:中徽建技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。