System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及集群部署,尤其涉及一種雙集群部署方法、裝置、設備及存儲介質。
技術介紹
1、工業互聯網平臺是面向制造業數字化、網絡化、智能化需求,構建基于海量數據采集、匯聚、分析的服務體系,支撐制造資源泛在連接、彈性供給、高效配置的工業云平臺。其不僅承載著設備監控、數據分析、生產調度等關鍵任務,還涉及大量敏感數據的處理與傳輸,任何系統停機或數據丟失都可能對企業造成重大經濟損失,甚至引發安全事故,因此,隨著工業互聯網平臺的廣泛應用,對其穩定性和高可用性的要求日益提高。為了實現平臺的高可用性和穩定性,通常基于部署容器的方式進行部署,主流是采用基于kubernetes(簡稱k8s)的高可用部署方法對工業互聯網平臺進行部署,kubernetes集群具有高可用、自我修復和負載均衡等特性,能夠自動管理容器化應用的部署、擴展和運維,有效提升平臺的穩定性和可靠性。然而,kubernetes集群雖然能夠解決集群內單節點故障等問題,但在面對集群故障時,如硬件故障、網絡中斷或誤操作導致的整個kubernete集群不可用,無法保證該集群內業務的高可用性。
2、在相關技術中,主要采用跨集群多實例部署的方案來解決集群級別故障,即通過將一集群內的應用以多實例的方式分布部署于不同集群中來提供服務,即使某一集群故障也不會影響起亞集群的實例,以確保服務的可用性。然而,工業互聯網平臺中的部分應用由于業務邏輯復雜、數據一致性要求高或資源限制等原因,只能以單實例形式部署,不適用于多實施例的部署方案,在面對集群故障時,無法通過多實例部署來分散風險,仍需依賴于人工干預
技術實現思路
1、為了對披露的實施例的一些方面有基本的理解,下面給出了簡單的概括。所述概括不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍,而是作為后面的詳細說明的序言。
2、鑒于以上所述現有技術的缺點,本申請公開了一種雙集群部署方法、裝置、設備及存儲介質,以解決上述如何在集群發生故障時確保平臺的高可用性的技術問題。
3、第一方面,本申請提供了一種雙集群部署方法,所述方法包括:基于部署容器創建第一集群和第二集群,所述第二集群為所述第一集群的備用集群;若監測到所述第一集群為不可用狀態,則獲取所述第一集群的備份文件,所述備份文件包括存儲有所述第一集群的元數據的第一備份文件,以及存儲有所述第一集群所關聯第一數據卷的業務數據的第二備份文件;基于所述第一備份文件對所述第二集群進行配置,并根據預設第一映射關系將所述第二備份文件同步至所述第二集群所關聯的第二數據卷,所述預設第一映射關系為所述第一數據卷和所述第二數據卷之間的映射關系;將所述第一集群上部署的業務切換至所述第二集群進行承載。
4、于本申請一實施例中,在所述若監測到所述第一集群為不可用狀態之前,還包括:監測所述第一集群的各目標指標,所述目標指標包括節點健康指標、組件健康指標、pod健康指標、服務健康指標、網絡狀態指標和存儲狀態指標;對各所述目標指標進行加權評分,得到所述第一集群的故障評分;若所述第一集群的故障評分低于預設分數閾值,則確定所述第一集群為不可用狀態。
5、于本申請一實施例中,所述對各所述目標指標進行加權評分,得到所述第一集群的故障評分,包括:獲取所述第一集群的應用場景;根據預設第二映射關系對所述應用場景進行匹配,基于匹配結果對各所述目標指標進行權重分配,確定每一所述目標指標的目標權重,所述預設第二映射關系為所述應用場景和各所述目標指標的所述目標權重之間的映射關系;根據每一所述目標指標的所述目標權重對各所述目標指標進行加權評分,得到所述第一集群的所述故障評分。
6、于本申請一實施例中,所述監測所述第一集群的各目標指標,包括:監測所述第一集群中節點、組件、pod和服務的運行狀態,以及網絡狀態和存儲狀態;將運行狀態為健康狀態的所述節點的數量和所述節點的總數量進行比值計算,確定所述節點健康指標;將運行狀態為健康狀態的所述組件的數量和所述組件的總數量進行比值計算,確定所述組件健康指標;將運行狀態為健康狀態的所述pod的數量和所述pod的總數量進行比值計算,確定所述pod健康指標;將運行狀態為健康狀態的所述服務的數量和所述服務的總數量進行比值計算,確定所述服務健康指標;根據所述網絡狀態包括的網絡連通性、網絡延遲和丟包率確定所述網絡狀態指標;根據所述存儲狀態包括的存儲容量和存儲性能確定所述存儲狀態指標。
7、于本申請一實施例中,在所述獲取所述第一集群的備份文件之前,還包括:對所述第一集群的所述元數據和所述第一集群關聯的所述第一數據卷進行備份,得到所述第一備份文件和所述第二備份文件;檢測所述第一備份文件和所述第二備份文件的有效性;若所述第一備份文件和所述第二備份文件均具備有效性,則將所述第一備份文件和所述第二備份文件上傳至目標存儲空間,所述目標存儲空間由預設對象存儲服務提供。
8、于本申請一實施例中,所述對所述第一集群的元數據和所述第一集群關聯的數據卷進行備份,還包括:當每間隔預設時間或觸發預設事件時,對所述第一集群的所述元數據和所述第一集群關聯的所述第一數據卷進行備份;其中,對備份的所述元數據進行序列化處理,生成所述第一備份文件;對所述第一數據卷進行快照處理,生成所述第一數據卷的快照文件,并作為所述第二備份文件。
9、于本申請一實施例中,所述獲取所述第一集群的備份文件,還包括:若存在至少兩個所述備份文件,則對比各所述備份文件的時間戳;將距離當前時間最近的所述備份文件確定目標備份文件;獲取所第一集群的所述目標備份文件。
10、第二方面,本申請提供了一種雙集群部署裝置,所述裝置包括:創建模塊,用于基于部署容器創建第一集群和第二集群,所述第二集群為所述第一集群的備用集群;監測模塊,用于若監測到所述第一集群為不可用狀態,則獲取所述第一集群的備份文件,所述備份文件包括存儲有所述第一集群的元數據的第一備份文件,以及存儲有所述第一集群所關聯第一數據卷的業務數據的第二備份文件;數據同步模塊,用于基于所述第一備份文件對所述第二集群進行配置,并根據預設第一映射關系將所述第二備份文件同步至所述第二集群所關聯的第二數據卷,所述預設第一映射關系為所述第一數據卷和所述第二數據卷之間的映射關系;業務切換模塊,用于將所述第一集群上部署的業務切換至所述第二集群進行承載。
11、第三方面,本申請還提供了一種電子設備,包括:處理器、存儲器和通信總線;所述通信總線用于將所述處理器和存儲器連接;所述處理器用于執行所述存儲器中存儲的計算機程序,以實現如上述實施例中所述的雙集群部署方法。
12、第四方面,本申請提供了一種計算機可讀存儲介質,其上存儲有計算機程序,當計算機程序被計算機的處理器執行時,使計算機執行如上述實施例中所述的雙集群部署方法。
13、本申請的有益效果:本申請提出了一種雙集群部署方法、裝置、設備及存本文檔來自技高網...
【技術保護點】
1.一種雙集群部署方法,其特征在于,所述方法包括:
2.根據權利要求1所述的雙集群部署方法,其特征在于,在所述若監測到所述第一集群為不可用狀態之前,還包括:
3.根據權利要求2所述的雙集群部署方法,其特征在于,所述對各所述目標指標進行加權評分,得到所述第一集群的故障評分,包括:
4.根據權利要求2所述的雙集群部署方法,其特征在于,所述監測所述第一集群的各目標指標,包括:
5.根據權利要求1所述的雙集群部署方法,其特征在于,在所述獲取所述第一集群的備份文件之前,還包括:
6.根據權利要求5所述的雙集群部署方法,其特征在于,所述對所述第一集群的元數據和所述第一集群關聯的數據卷進行備份,還包括:
7.根據權利要求1至6任一所述的雙集群部署方法,其特征在于,所述獲取所述第一集群的備份文件,還包括:
8.一種雙集群部署裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,包括:處理器、存儲器和通信總線;所述通信總線用于將所述處理器和存儲器連接;所述處理器用于執行所述存儲器中存儲的計算機
10.一種計算機可讀存儲介質,其特征在于,其上存儲有計算機程序,所述計算機程序用于使計算機執行如權利要求1至7任一項所述的方法。
...【技術特征摘要】
1.一種雙集群部署方法,其特征在于,所述方法包括:
2.根據權利要求1所述的雙集群部署方法,其特征在于,在所述若監測到所述第一集群為不可用狀態之前,還包括:
3.根據權利要求2所述的雙集群部署方法,其特征在于,所述對各所述目標指標進行加權評分,得到所述第一集群的故障評分,包括:
4.根據權利要求2所述的雙集群部署方法,其特征在于,所述監測所述第一集群的各目標指標,包括:
5.根據權利要求1所述的雙集群部署方法,其特征在于,在所述獲取所述第一集群的備份文件之前,還包括:
6.根據權利要求5所述的雙集群部署方法,其特征在于,所述對...
【專利技術屬性】
技術研發人員:張琨,那蓉萃,黃毓,彭燕華,
申請(專利權)人:中冶賽迪信息技術重慶有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。