本發明專利技術公開了一種綜合前端系統故障處理方法,包括:檢測綜合前端系統是否出現故障;當檢測到所述綜合前端系統出現了故障時,分析所述故障的類別;當分析出所述故障的類別時,根據所述故障的類別選擇所對應的故障處理模式對所述故障進行處理。本發明專利技術還公開了一種計算機設備,采用本發明專利技術所提供的方案,通過分析檢測出的故障類別,并根據故障類別選擇所對應的故障處理模式對故障進行處理,改變以往對故障完全依賴于人工診斷和處理的模式,減少了處理時間,保障了系統連續穩定的運行。
【技術實現步驟摘要】
本專利技術涉及計算機應用領域,尤其涉及一種綜合前端系統故障處理方法 及計算機設備。
技術介紹
目前銀行前端上線營運系統的重大故障(服務器宕機等)處理模式基本 上停留在前臺報告故障,分析運維人員經過初步分析后,通過熱線與后臺技 術專家團隊溝通,由后臺專家遠程分析解決問題,其實現的全過程基本上全 部由人工完成。隨著銀行業務的發展,銀行對生產系統穩定運行的要求越來越嚴格,傳 統的全人工處理流程無法滿足整個系統運營的要求,由于完全靠人工處理,診斷全憑經驗,許多情況下無法立刻給出處理預案,難以保證運行的穩定性; 且對于故障出現之后,其診斷過程和分析取決于維護人員和專家團隊的溝通 效率,/人而不能保證快速解決故障,而且人工解決方式其人工成本也4艮高。
技術實現思路
鑒于上述現有技術所存在的問題,本專利技術提供了一種綜合前端系統故障 處理方法及計算機設備,對于綜合前端系統出現的故障采取不同的處理方法。為了達到上述專利技術目的,本專利技術提供了一種綜合前端系統故障處理方法, 包括檢測綜合前端系統是否出現故障;當檢測到綜合前端系統出現了故障時,分析所述故障的類別; 當分析出所述故障的類別時,根據所述故障的類別選擇所迷故障的類別 所對應的故障處理模式對所述故障進行處理。相應地,本專利技術還提供了一種計算機設備,包括 檢測模塊,用于檢測綜合前端系統是否出現故障;分析模塊,用于當所述檢測模塊檢測到綜合前端系統出現了故障時,分析所述故障的類別;處理模塊,用于當所述分析模塊分析出所述故障的類別時,根據所述故 障的類別選擇所對應的故障處理才莫式對所迷故障進行處理。通過實施本專利技術,在;^測綜合前端系統出現故障時,對出現的故障進行 分析出故障的類別,再根據故障的類別選擇所對應的故障處理^i式對故障進 行處理,這樣通過針對不同級別的故障,采用不同的處理模式,減少處理時 間,保障了系統連續穩定的運行。附圖說明圖l是本專利技術實施例的綜合前端系統故障處理方法的流程圖; 圖2是本專利技術實施例的計算機設備的結構示意圖。具體實施例方式實施本專利技術實施例通過在綜合前端系統增加了故障診斷手段和處理手段, 改變了以往完全依賴于人工診斷和處理故障的模式,下面結合附圖來詳細說 明。首先,請參閱圖l,圖l示出了本專利技術實施例的綜合前端系統故障處理方 法的流程圖,包括以下步驟 步驟S101,開始;步驟S102,檢測綜合前端系統是否現出故障,若檢測到綜合前端系統出 現故障,則進行步驟S103,否則繼續進行步驟S102;具體的,在綜合前端系統中設置一個軟件客戶端,通過相應的軟件客戶 端來監控綜合前端系統,當檢測到綜合前端系統出現故障時,執行步驟S103。系統一般可以分為操作系統,基礎軟件系統,應用軟件模塊(通訊, 服務,安全,數據庫)等層次。監控平臺會每隔一段時間(可以設定)啟動 安裝在服務器上的代理程序(Agent),啟動一個系統檢查腳本,首先檢查各 參數是否在設定的正常范圍內。例如文件描述符、進程數、已經使用的中央 處理器(CPU)消耗、內存(MEM)消耗等這樣的操作系統參數是否會超過 設定的安全閥值;例如已使用的線程、連接數等這樣的服務器參數是否超過設定的安全閥值。然后檢查運行進程列表各中關鍵進程(主進程,通訊進程, 安全服務進程)是否缺失。接下來自動測試各端口是否處于正常監聽狀態, 如果出現問題就會給出相應提示。隨后代理程序會發起一個模擬交易(可以設定判斷策略,例如每分鐘發起3次交易,如果成功2次代表正常),測試系 統的反應,從而判斷系統的狀態,并且如果未能得到預期結果或者超時(可 以設定時間),會通過返回碼提示進程在哪個軟件模塊內出現異常。這個過 程基本覆蓋了系統的各層次,并且基本能夠基本判斷在哪一個層次或模塊出 現異常。步驟S103,分析故障的類別;具體的,根據故障威脅程度將檢測出的故障進行分析,其故障類別主要 是系統級故障和應用級故障,其中,系統級故障包括硬件故障和操作故障, 應用級故障包括基礎軟件故障和交易級故障。在實施過程中,對綜合前端系統上的數據進行收集,當檢測到綜合前端 系統出現故障時,分析故障所處的環境和位置,若是系統本身自身檢測到的 故障,在上報故障過程中,可以獲知該系統故障的類別;也可以根據基礎軟 件的日志上報故障信息,根據該日志上報的故障信息分析出該故障的類別。 這里主要采用的方式是系統內部的自偵測故障模式,在進行故障收集,根據 收集的故障來分析出故障的類別。步驟S104,根據所述故障類別選擇所對應的故障處理模式對所述故障進 行處理。具體的,根據故障類別選擇故障處理模式對出現的故障進行相應處理, 故障處理4莫式為自動處理^^莫式或通知人工處理^t式。其中自動處理才莫式主 要由熱備機制提供技術支持,采用2+N分組熱備刀片集群,每組2片備機+N片 生產機(每組最多不超過10片),當生產刀片發生故障時,備份刀片會短時 間內自動接管,從而保證正常生產不間斷。自動處理模式可以處理系統故障 中的硬件故障因刀片服務器本身故障導致的連續運行問題和滿足操作系統故 障連續運行的需求,同時也可以解決應用級故障中的基礎軟件故障,自動處 理模式只需要重新啟動系統就可以運行的故障導致的連續運行問題。通知人 工處理模式可以處理所有級別的故障,其主要用于分析和解決問題。進一步需要說明的,在此過程中,可以首先對故障分析后,下發故障告警方式給管理平臺或者管理人員,如通過短信或者郵件或者日志報告等方式 讓管理人員獲得故障信息。步驟S105:結束。通過實施本專利技術實施例,在檢測綜合前端系統出現故障時,對出現的故 障進行分析出故障的類別,再根據故障的類別選擇所對應的故障處理模式對 故障進行處理,這樣通過針對不同級別的故障,采用不同的處理模式,減少 處理時間,保障了系統連續穩定的運行。請參閱圖2,圖2示出了本專利技術實施例的計算機設備的結構示意圖,包括 檢測模塊21、分析模塊22和處理模塊23,其中檢測模塊21 ,用于檢測綜合前端系統是否出現故障;具體的,在綜合前端系統中設置一個軟件客戶端,通過相應的軟件客戶 端來監控綜合前端系統。分析模塊22,用于當所述檢測模塊21檢測到綜合前端系統出現了故障時, 分析所述故障的類別;具體的,根據故障威脅程度將檢測出的故障進行分析,其故障類別主要 分為系統級故障和應用級故障,其中,系統級故障包括硬件故障和操作故障, 應用級故障包括^出軟件故障和交易級故障。在實施過程中,檢測到綜合前端系統出現故障時,分析故障所處的環境 和位置,若是系統本身自身檢測到的故障,在上報故障過程中,可以獲知該 系統故障的類別;也可以根據基礎軟件的日志上報故障信息,根據該日志上 報的故障信息分析出該故障的類別。這里主要采用的方式是系統內部的自偵 測故障才莫式,在進行故障收集,才艮據收集的故障來分析出故障的類別。處理模塊23,用于當所述分析模塊22分析出所述故障的類別時,根據所 述故障的類別選擇所述故障的類別所對應的故障處理才莫式對所述故障進行處 理。具體的,根據故障類別選擇所對應的故障處理模式對所述故障進行處理, 故障處理模式為自動處理模式或通知人工處理模式。自動處理模式主要由熱 備機制提供技術支持,采用2+N分組熱備刀片集群,每組2片備機+N片生產機 (每組最多不超過10片),當生產刀片發生本文檔來自技高網...
【技術保護點】
一種綜合前端系統故障處理方法,其特征在于,包括: 檢測綜合前端系統是否出現故障; 當檢測到所述綜合前端系統出現了故障時,分析所述故障的類別; 當分析出所述故障的類別時,根據所述故障的類別選擇所述故障的類別所對應的故障處理模 式對所述故障進行處理。
【技術特征摘要】
【專利技術屬性】
技術研發人員:胡宏,王臻,卜天奇,楊志勇,周子堅,杜永健,邵靜,羅意,曾燁,耿蕓,
申請(專利權)人:中國建設銀行股份有限公司,
類型:發明
國別省市:11[中國|北京]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。