System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算機,特別涉及一種操作系統修復恢復方法和裝置。
技術介紹
1、在現有技術的應用場景中,用戶終端需要安裝操作系統才可以被用戶使用。在終端設備安裝操作系統后,為了保障用戶業務正常運行,還需要在數據和業務軟件以及運行環境做容災儲備,以降低業務和數據的中斷時間和造成的損失。然而,對于受損的系統環境,不同系統的優先級不同,修復方法也不相同。現有大型業務系統,在使用虛擬環境時,往往會使用虛擬引擎提供的快照功能進行備份和恢復,但是出于性能要求,該類業務系統會在主機服務器上使用操作系統并將其關聯排布成計算集群來滿足業務需求,同時降低性能損耗;一旦這種系統環境受損,就需要重新安裝操作系統,并進行業務配置、恢復數據等流程,而且在集群環境下無法對操作系統內核損壞的單機進行系統重裝系統,因此會導致故障發生時業務和數據的中斷時間較長,損失較高。
技術實現思路
1、本專利技術提供了一種操作系統修復恢復方法和裝置,降低了集群環境中出現故障時業務和數據的中斷時間,提高了修復恢復效率,同時確保了操作系統的安全有效運行。
2、第一方面,本專利技術提供了一種操作系統修復恢復方法,應用于集群環境,包括:
3、在集群中部署控制節點、工作節點和備用節點;所述控制節點分別與所述工作節點和所述備用節點連接;所述工作節點用于運行用戶業務,所述備用節點為備用的工作節點;
4、響應于所述工作節點發生故障時,確定故障節點;
5、所述控制節點將所述備用節點調度為該工作節點,并
6、在所述故障節點完成修復后,所述控制節點將完成修復的該故障節點調度為所述備用節點。
7、可選地,所述對所述故障節點進行修復,包括:
8、所述控制節點向所述故障節點發送所述故障節點對應的掛載外部內核,并由所述故障節點向所述控制節點反饋準備完成信號;
9、所述控制節點基于所述準備完成信號向所述故障節點發送第一救援恢復指令,所述故障節點基于接收到的所述第一救援恢復指令進行恢復,并實時更新所述故障節點的恢復標識;
10、所述控制節點在發送所述救援恢復指令后周期性向所述故障節點發送連接請求以獲取所述恢復標識和所述故障節點的當前狀態;
11、所述控制節點根據所述當前狀態和所述恢復標識,判斷所述故障節點是否完成修復。
12、可選地,所述控制節點基于所述準備完成信號向所述故障節點發送第一救援恢復指令,所述故障節點基于接收到的所述第一救援恢復指令進行恢復,并實時更新所述故障節點的恢復標識,包括:
13、所述控制節點基于所述準備完成信號向所述故障節點發送所述第一救援恢復指令;
14、所述故障節點基于接收到的所述第一救援恢復指令,依次進入恢復準備階段、配置目標ip地址和恢復階段;其中,所述目標ip地址與所述控制節點的ip地址相同;
15、其中,所述恢復準備階段依次包括重啟系統、進入救援模式、增加恢復標識并設置所述恢復標識的第一恢復狀態碼,所述第一恢復狀態碼用于表征所述故障節點處于恢復中;所述恢復階段依次包括基于所述掛載外部內核掛載nfs、恢復系統、回退至故障前最后一次備份的相關業務文件以及設置所述恢復標識的第二恢復狀態碼,所述第二恢復狀態碼用于表征所述故障節點完成修復。
16、可選地,所述控制節點在發送所述救援恢復指令后周期性向所述故障節點發送連接請求以獲取所述恢復標識和所述故障節點的當前狀態,包括:
17、在所述故障節點配置所述目標ip地址后,所述控制節點基于所述連接請求與所述故障節點建立連接,獲取所述恢復標識;
18、根據所述恢復標識和所述控制節點與所述故障節點的連接狀態,確定所述故障節點的當前狀態。
19、可選地,所述控制節點向所述故障節點發送所述故障節點對應的掛載外部內核,并由所述故障節點向所述控制節點反饋準備完成信號,包括:
20、所述外部內核采用所述故障節點的救援模式,將救援模式作為第一優先級啟動模式;并判斷所述故障節點是否存在恢復標識,若存在則去除所述恢復標識,由所述故障節點向所述控制節點反饋準備完成信號。
21、可選地,所述控制節點向所述故障節點發送所述故障節點對應的掛載外部內核,并由所述故障節點向所述控制節點反饋準備完成信號,包括:
22、所述外部內核采用外部設備,所述故障節點在掛載所述外部設備后,向所述控制節點反饋準備完成信號。
23、可選地,所述控制節點將完成修復的該故障節點調度為所述備用節點,包括:
24、在所述故障節點完成修復后,所述控制節點向所述故障節點發送第二救援恢復指令;
25、所述故障節點基于接收到的所述第二救援恢復指令進行系統重啟,將重啟后的該故障節點調度為所述備用節點。
26、第二方面,本專利技術提供了一種操作系統修復恢復裝置,應用于集群環境,包括:
27、部署模塊,用于在集群中部署控制節點、工作節點和備用節點;所述控制節點分別與所述工作節點和所述備用節點連接;所述工作節點用于運行用戶業務,所述備用節點為備用的工作節點;
28、檢測修復模塊,用于在檢測到所述工作節點發生故障時,確定故障節點;基于所述控制節點將所述備用節點調度為該工作節點,并對所述故障節點進行修復;以及在所述故障節點完成修復后,由所述控制節點將完成修復的該故障節點調度為所述備用節點。
29、第三方面,本專利技術實施例還提供了一種計算設備,包括存儲器和目標處理器,所述存儲器中存儲有計算機程序,所述目標處理器執行所述計算機程序時,實現本說明書任一第一方面所述的方法。
30、第四方面,本專利技術實施例還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,當所述計算機程序在計算機中執行時,令計算機執行本說明書任一第一方面所述的方法。
31、第五方面,本專利技術實施例還提供了一種計算機程序產品,包括計算機指令,所述計算機指令被處理器執行時實現本說明書任一第一方面所述的方法的步驟。
32、本專利技術提供了一種操作系統修復恢復方法和裝置,該方法應用于集群環境中,通過在集群環境中部署控制節點、用于運行用戶業務的工作節點和備用節點,在工作節點發送故障成為故障節點時,由控制節點將備用節點調度為工作節點用于繼續運行用戶業務,并對故障節點進行修復,在故障節點完成修復后,再由控制節點將完成修復的該故障節點調度為備用節點。如此,在本專利技術的集群環境中一直存在冗余的備用節點,一旦出現故障節點,立即由備用節點替換掉,以及時確保整個集群業務的安全運行,進而降低了業務和數據的中斷時間,提高了恢復效率;同時由控制節點主動對故障節點進行修復,避免因故障節點自身的不穩定性而影響恢復工作的安全可控。
本文檔來自技高網...【技術保護點】
1.一種操作系統修復恢復方法,其特征在于,應用于集群環境,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述故障節點進行修復,包括:
3.根據權利要求2所述的方法,其特征在于,所述控制節點基于所述準備完成信號向所述故障節點發送第一救援恢復指令,所述故障節點基于接收到的所述第一救援恢復指令進行恢復,并實時更新所述故障節點的恢復標識,包括:
4.根據權利要求3所述的方法,其特征在于,所述控制節點在發送所述救援恢復指令后周期性向所述故障節點發送連接請求以獲取所述恢復標識和所述故障節點的當前狀態,包括:
5.根據權利要求2所述的方法,其特征在于,所述控制節點向所述故障節點發送所述故障節點對應的掛載外部內核,并由所述故障節點向所述控制節點反饋準備完成信號,包括:
6.根據權利要求1至5中任一所述的方法,其特征在于,所述控制節點將完成修復的該故障節點調度為所述備用節點,包括:
7.一種操作系統修復恢復裝置,其特征在于,應用于集群環境,包括:
8.一種計算設備,包括存儲器和處理器,所述存儲器中存儲有計
9.一種計算機可讀存儲介質,其上存儲有計算機程序,當所述計算機程序在計算機中執行時,令計算機執行權利要求1-6中任一項所述的方法。
10.一種計算機程序產品,其特征在于,包括計算機指令,所述計算機指令被處理器執行時實現如權利要求1-6中任一項所述的方法的步驟。
...【技術特征摘要】
1.一種操作系統修復恢復方法,其特征在于,應用于集群環境,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述故障節點進行修復,包括:
3.根據權利要求2所述的方法,其特征在于,所述控制節點基于所述準備完成信號向所述故障節點發送第一救援恢復指令,所述故障節點基于接收到的所述第一救援恢復指令進行恢復,并實時更新所述故障節點的恢復標識,包括:
4.根據權利要求3所述的方法,其特征在于,所述控制節點在發送所述救援恢復指令后周期性向所述故障節點發送連接請求以獲取所述恢復標識和所述故障節點的當前狀態,包括:
5.根據權利要求2所述的方法,其特征在于,所述控制節點向所述故障節點發送所述故障節點對應的掛載外部內核,并由所述故障節點向...
【專利技術屬性】
技術研發人員:秦志偉,劉振啟,陳志強,李宇哲,徐寧,
申請(專利權)人:北京長擎軟件有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。