本申請提供一種作業監控系統和異常作業定位方法,應用于作業管理技術領域,包括:實時監控作業管控系統中的各個作業的工作情況,當存在滿足預設的告警條件時,將該作業確定為目標作業,生成目標作業的告警信號;基于告警信號,使用作業鏈路數據模型,構建目標作業的作業鏈路;獲取各個作業的當前狀態數據,基于各個當前狀態數據和目標作業的作業鏈路,定位與目標作業對應的異常作業。由此,無需運維人員逐層追蹤作業鏈路,可快速定位異常作業,避免出現遺漏或誤判的情況,減少運維人員的工作量。
【技術實現步驟摘要】
本專利技術涉及作業管理,特別涉及一種作業監控系統和異常作業定位方法。
技術介紹
1、在現代企業運營中,跟蹤和分析系統中各種作業之間的關系和流程對于運維管理至關重要。這些作業可能涉及到諸如數據處理、服務調用、任務調度等多種業務活動,它們的有效管理和監控直接關系到企業的運營效率和穩定性。在運維應急場景下,更是需要及時準確地了解作業鏈路的運行情況,以快速定位和解決問題,保障系統的正常運行。
2、在傳統的作業運維管理中,當某個作業發生異常時,通常只能依據其靜態描述,來逐層追溯上游根因的問題作業。然而大型企業的系統規模龐大,往往存在百萬級數量的作業,且作業鏈路更加復雜,在這種情況下,運維人員往往需要花費大量的時間和精力,人工逐級追蹤作業鏈路,以定位異常作業。這種方式不僅耗時耗力,而且容易出現遺漏或誤判,延長了故障處理的時間,影響系統的正常運行。
技術實現思路
1、有鑒于此,本申請實施例提供一種作業監控系統和異常作業定位方法,應用本申請提供的方案,無需運維人員逐層追蹤作業鏈路,使用構建的作業鏈路數據模型構建作業鏈路,進而使用作業鏈路定位異常作業,避免遺漏或誤判的發生,可以快速定位異常作業,減少運維工作人員的工作負擔。
2、為實現上述目的,本申請實施例提供如下技術方案:
3、一種作業監控系統,包括:
4、數據采集單元、數據處理單元、圖數據庫、查詢服務單元和監控服務單元;
5、所述數據采集單元,用于從作業管控系統獲取各個作業的配置數據;</p>6、所述數據處理單元,用于接收所述數據采集單元發送的各個作業的配置數據,并從每個所述配置數據中抽取出每個所述作業的各個節點和節點關系數據,每個所述作業的各個節點包括作業節點和輸出節點;
7、所述圖數據庫,用于構建統一的作業鏈路數據模型,以及保存各個所述作業的節點關系數據,所述作業鏈路數據模型用于基于作業的節點關系數據,構建作業的作業鏈路;
8、所述監控服務單元,用于實時監控所述作業管控系統中的各個作業的工作情況,判斷是否存在滿足預設的告警條件的作業,當存在滿足所述告警條件的作業時,將該作業確定為目標作業,生成所述目標作業的告警信號,并將所述告警信號向所述查詢服務單元發送;
9、所述查詢服務單元,用于接收所述告警信號,獲取使用所述圖數據庫中的作業鏈路數據模型構建的所述目標作業的作業鏈路,從所述數據采集單元獲取各個所述作業的當前狀態數據,并基于各個所述作業的當前狀態數據和所述目標作業的作業鏈路,定位與所述目標作業對應的異常作業。
10、上述的系統,可選的,所述數據處理單元執行從每個所述配置數據中抽取出每個所述作業的各個節點和節點關系數據的過程,包括:
11、從每個所述作業的配置數據中獲取每個所述作業的作業流信息、作業名稱信息以及輸出信息;
12、對于每個所述作業,應用所述作業的作業名稱信息構建作業節點,以及應用所述作業的輸出信息構建輸出節點,并將生成所述作業節點的第一關聯信息以所述輸出節點的第二關聯信息,并基于所述作業流信息、所述第一關聯信息以及所述第二關聯信息生成節點關系數據。
13、上述的系統,可選的,所述查詢服務單元執行獲取使用所述圖數據庫中的作業鏈路數據模型構建的所述目標作業的作業鏈路的過程,包括:
14、對于每個所述作業的作業節點,基于該作業的節點關系數據,確定該作業節點的關系節點,并依據所述作業鏈路數據模型,建立該作業節點與其關系節點的關系邊,得到該作業的鏈路結構;
15、基于所有作業的鏈路結構,得到全量作業鏈路數據;
16、從所述全量鏈路數據中獲取所述目標作業的作業鏈路。
17、上述的系統,可選的,所述監控服務單元執行判斷是否存在滿足預設的告警條件的作業的過程,包括:
18、獲取各個所述作業的執行狀態數據;
19、基于各個所述執行狀態數據,確定各個所述作業的執行狀態;
20、對于每個所述作業,當所述作業的執行狀態與所述告警條件中的告警狀態相匹配時,確定所述作業滿足告警條件。
21、上述的系統,可選的,所述查詢服務單元執行基于各個所述作業的當前狀態數據和所述目標作業的作業鏈路,定位與所述目標作業對應的異常作業的過程,包括:
22、基于各個所述作業的當前狀態數據,確定所述目標作業的作業鏈路中每個節點的當前狀態;
23、將所述目標作業的作業鏈路中所述目標作業的作業節點確定為目標節點,并將所述目標作業的作業鏈路的各個節點均確定為待確定節點;
24、將與所述目標節點最近,且當前狀態表征為異常的待確定節點確定為異常節點;
25、將與所述異常節點對應的作業確定為異常作業。
26、一種異常作業定位方法,包括:
27、實時監控作業管控系統中的各個作業的工作情況,確定是否存在滿足預設的告警條件的作業,當存在滿足預設的告警條件的作業時,將該作業確定為目標作業,并生成所述目標作業的告警信號;
28、基于所述告警信號,使用預先構建的作業鏈路數據模型構建所述目標作業的作業鏈路;
29、獲取各個所述作業的當前狀態數據,并基于各個所述作業的當前狀態數據和所述目標作業的作業鏈路,定位與所述目標作業對應的異常作業。
30、上述的方法,可選的,所述確定是否存在滿足預設的告警條件的作業,包括:
31、獲取各個所述作業的執行狀態數據;
32、基于各個所述執行狀態數據,確定各個所述作業的執行狀態;
33、對于每個所述作業,當所述作業的執行狀態與所述告警條件中的告警狀態相匹配時,確定所述作業滿足告警條件。
34、上述的方法,可選的,所述使用預先構建的作業鏈路數據模型構建所述目標作業的作業鏈路,包括:
35、獲取每個所述作業的配置數據,從每個所述配置數據中抽取出每個所述作業的各個節點和節點關系數據,每個所述作業的各個節點包括作業節點和輸出節點;
36、對于每個所述作業的作業節點,基于該作業的節點關系數據,確定該作業節點的關系節點,并依據所述作業鏈路數據模型,建立該作業節點與其關系節點的關系邊,得到該作業的鏈路結構;
37、基于所有作業的鏈路結構,得到全量作業鏈路數據;
38、從所述全量鏈路數據中獲取所述目標作業的作業鏈路。
39、上述的方法,可選的,所述從每個所述配置數據中抽取出每個所述作業的各個節點和節點關系數據,包括:
40、從每個所述作業的配置數據中獲取每個所述作業的作業流信息、作業名稱信息以及輸出信息;
41、對于每個所述作業,應用所述作業的作業名稱信息構建作業節點,以及應用所述作業的輸出信息構建輸出節點,并將生成所述作業節點的第一關聯信息以所述輸出節點的第二關聯信息,并基于所述作業流信息、所述第一關聯信息以及所述第二關聯信息生成節點關系數據本文檔來自技高網
...
【技術保護點】
1.一種作業監控系統,其特征在于,包括:
2.根據權利要求1所述的系統,其特征在于,所述數據處理單元執行從每個所述配置數據中抽取出每個所述作業的各個節點和節點關系數據的過程,包括:
3.根據權利要求1所述的系統,其特征在于,所述查詢服務單元執行獲取使用所述圖數據庫中的作業鏈路數據模型構建的所述目標作業的作業鏈路的過程,包括:
4.根據權利要求1所述的系統,其特征在于,所述監控服務單元執行判斷是否存在滿足預設的告警條件的作業的過程,包括:
5.根據權利要求1所述的系統,其特征在于,所述查詢服務單元執行基于各個所述作業的當前狀態數據和所述目標作業的作業鏈路,定位與所述目標作業對應的異常作業的過程,包括:
6.一種異常作業定位方法,其特征在于,包括:
7.根據權利要求6所述的方法,其特征在于,所述確定是否存在滿足預設的告警條件的作業,包括:
8.根據權利要求6所述的方法,其特征在于,所述使用預先構建的作業鏈路數據模型構建所述目標作業的作業鏈路,包括:
9.根據權利要求8所述的方法,其特征在于,所述從每個所述配置數據中抽取出每個所述作業的各個節點和節點關系數據,包括:
10.根據權利要求6所述的方法,其特征在于,所述基于各個所述作業的當前狀態數據和所述目標作業的作業鏈路,定位與所述目標作業對應的異常作業,包括:
...
【技術特征摘要】
1.一種作業監控系統,其特征在于,包括:
2.根據權利要求1所述的系統,其特征在于,所述數據處理單元執行從每個所述配置數據中抽取出每個所述作業的各個節點和節點關系數據的過程,包括:
3.根據權利要求1所述的系統,其特征在于,所述查詢服務單元執行獲取使用所述圖數據庫中的作業鏈路數據模型構建的所述目標作業的作業鏈路的過程,包括:
4.根據權利要求1所述的系統,其特征在于,所述監控服務單元執行判斷是否存在滿足預設的告警條件的作業的過程,包括:
5.根據權利要求1所述的系統,其特征在于,所述查詢服務單元執行基于各個所述作業的當前狀態數據和所述目標作業的作業鏈路,定位與...
【專利技術屬性】
技術研發人員:李秋貝,
申請(專利權)人:中國建設銀行股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。