System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及pcie(peripheral?component?interconnect?express,高速串行計算機擴展總線標準)設備領域,特別涉及一種設備狀態檢測系統、鏈路超時故障修復方法、設備及介質。
技術介紹
1、pcie(peripheral?component?interconnect?express,高速串行計算機擴展總線標準)是服務器設備中常見的總線,該總線具有傳輸速度高、時延低的特點。常見的pcie設備有顯卡設備(gpu,graphics?processing?unit)、基板管理控制器(bmc,baseboardmanagement?controller)。然而為滿足擴展需求,服務器設備中常會出現基于pcie接口進行跨版傳輸的現象,例如基板管理控制器設置于單獨的小板中,與服務器中央處理器不在同一主板。此時,中央處理器與pcie設備間的通信距離較長,若中央處理器無法在短期內獲得pcie設備的設備信息,便會認定與pcie設備間的鏈路超時、pcie設備故障,進而影響服務器的正常運行。
技術實現思路
1、本專利技術的目的是提供一種設備狀態檢測系統、鏈路超時故障修復方法、設備及介質,可使用基本輸入輸出系統、硬件檢測單元從多角度對pcie設備的工作狀態進行檢測,從而避免中央處理器僅根據鏈路超時標志確定待測設備是否故障,從而可提升服務器的運行穩定性。
2、為解決上述技術問題,本專利技術提供一種設備狀態檢測系統,包括:中央處理器、基本輸入輸出系統、待測設備及硬件
3、所述中央處理器,用于在確定與所述待測設備間的鏈路超時標志調整為超時狀態時,向所述基本輸入輸出系統獲取所述待測設備的工作狀態,并在根據所述工作狀態確定所述待測設備正常工作時,將所述鏈路超時標志調整為未超時狀態;
4、所述基本輸入輸出系統,用于向所述待測設備獲取設備狀態,以及向所述硬件檢測單元獲取所述待測設備的硬件狀態,并在確定所述設備狀態和所述硬件狀態均正常時將所述工作狀態設置為正常工作,或在確定所述設備狀態和所述硬件狀態中任一者異常時將所述工作狀態設置為未正常工作;
5、所述硬件檢測單元,用于向所述待測設備獲取所述設備狀態,以及接收所述待測設備發送的心跳信號,并在確定所述設備狀態和所述心跳信號均正常時將所述硬件狀態設置為硬件正常,在確定所述設備狀態和所述心跳信號中任一者異常時將所述硬件狀態設置為硬件異常。
6、可選地,所述中央處理器,還用于:
7、在確定所述工作狀態為未正常工作時,不調整所述鏈路超時標志,并輸出表示所述待測設備出現硬件故障的告警信息。
8、可選地,所述硬件檢測單元,還用于:
9、在確定所述設備狀態和所述心跳信號均正常時向所述基本輸入輸出系統持續發送表示硬件正常的硬件狀態信號,在確定所述設備狀態和所述心跳信號中任一者異常時向所述基本輸入輸出系統持續發送表示硬件異常的硬件狀態信號。
10、可選地,所述基本輸入輸出系統,還用于從所述待測設備的狀態寄存器中獲取所述設備狀態;
11、所述硬件檢測單元,還用于從所述待測設備的狀態寄存器中獲取所述設備狀態。
12、可選地,所述待測設備,用于在上電啟動時,獲取自身的內核初始化狀態,并將所述內核初始化狀態寫入所述狀態寄存器;
13、所述硬件檢測單元,還用于向所述待測設備獲取所述內核初始化狀態,以及接收所述待測設備發送的心跳信號,并在確定所述內核初始化狀態和所述心跳信號均正常時將所述硬件狀態設置為硬件正常,在確定所述內核初始化狀態和所述心跳信號中任一者異常時將所述硬件狀態設置為硬件異常;
14、所述基本輸入輸出系統,用于向所述待測設備獲取所述內核初始化狀態,以及向所述硬件檢測單元獲取所述待測設備的硬件狀態,并在確定所述內核初始化狀態和所述硬件狀態均正常時確定所述待測設備正常啟動,在確定所述內核初始化狀態和所述硬件狀態任一者為異常狀態時引導所述待測設備重新啟動。
15、可選地,所述基本輸入輸出系統,還用于:
16、記錄所述待測設備的重啟次數,并判斷所述重啟次數是否達到預設值;
17、若確定所述重啟次數達到預設值,則輸出表示所述待測設備出現硬件故障的告警信息。
18、可選地,所述硬件檢測單元,還用于:
19、判斷所述心跳信號的頻率是否為預設頻率;
20、若確定所述心跳信號的頻率不為所述預設頻率,則確定所述心跳信號處于異常狀態。
21、可選地,所述待測設備為基板管理控制器,所述硬件檢測單元為復雜可編程邏輯器件或現場可編程邏輯門陣列。
22、本專利技術還提供一種鏈路超時故障修復方法,應用于如上所述的設備狀態檢測系統,所述方法包括:
23、中央處理器在確定與所述待測設備間的鏈路超時標志調整為超時狀態時,向所述基本輸入輸出系統獲取所述待測設備的工作狀態;
24、所述基本輸入輸出系統向所述待測設備獲取設備狀態;
25、所述硬件檢測單元向所述待測設備獲取所述設備狀態,以及接收所述待測設備發送的心跳信號;在確定所述設備狀態和所述心跳信號均正常時將所述硬件狀態設置為硬件正常,或在確定所述設備狀態和所述心跳信號中任一者異常時將所述硬件狀態設置為硬件異常;向所述基本輸入輸出系統返回所述硬件狀態;
26、所述基本輸入輸出系統向所述硬件檢測單元獲取所述待測設備的硬件狀態;在確定所述設備狀態和所述硬件狀態均正常時將所述工作狀態設置為正常工作,或在確定所述設備狀態和所述硬件狀態中任一者異常時將所述工作狀態設置為未正常工作;向所述中央處理器返回所述工作狀態;
27、所述中央處理器在根據所述工作狀態確定所述待測設備正常工作時,將所述鏈路超時標志調整為未超時狀態。
28、本專利技術還提供一種電子設備,包括如上所述的設備狀態檢測系統。
29、本專利技術還提供一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有計算機可執行指令,所述計算機可執行指令被處理器加載并執行時,實現如上所述的鏈路超時故障修復方法。
30、本專利技術提供一種設備狀態檢測系統,包括:中央處理器、基本輸入輸出系統、待測設備及硬件檢測單元,所述中央處理器與所述待測設備通過高速串行計算機擴展總線連接,所述中央處理器與所述基本輸入輸出系統連接,所述基本輸入輸出系統與所述待測設備和所述硬件檢測單元連接,所述硬件檢測單元與所述待測設備連接;所述中央處理器,用于在確定與所述待測設備間的鏈路超時標志調整為超時狀態時,向所述基本輸入輸出系統獲取所述待測設備的工作狀態,并在根據所述工作狀態確定所述待測設備正常工作時,將所述鏈路超時標志調整為未超時狀態;所述基本輸入輸本文檔來自技高網...
【技術保護點】
1.一種設備狀態檢測系統,其特征在于,包括:中央處理器、基本輸入輸出系統、待測設備及硬件檢測單元,所述中央處理器與所述待測設備通過高速串行計算機擴展總線連接,所述中央處理器與所述基本輸入輸出系統連接,所述基本輸入輸出系統與所述待測設備和所述硬件檢測單元連接,所述硬件檢測單元與所述待測設備連接;
2.根據權利要求1所述的設備狀態檢測系統,其特征在于,所述中央處理器,還用于:
3.根據權利要求1所述的設備狀態檢測系統,其特征在于,所述基本輸入輸出系統,還用于從所述待測設備的狀態寄存器中獲取所述設備狀態;
4.根據權利要求2所述的設備狀態檢測系統,其特征在于,所述待測設備,用于在上電啟動時,獲取自身的內核初始化狀態,并將所述內核初始化狀態寫入所述狀態寄存器;
5.根據權利要求3所述的設備狀態檢測系統,其特征在于,所述基本輸入輸出系統,還用于:
6.根據權利要求1所述的設備狀態檢測系統,其特征在于,所述硬件檢測單元,還用于:
7.根據權利要求1所述的設備狀態檢測系統,其特征在于,所述待測設備為基板管理控制器,所述硬件
8.一種鏈路超時故障修復方法,其特征在于,應用于如權利要求1至7任一項所述的設備狀態檢測系統,所述方法包括:
9.一種電子設備,其特征在于,包括如權利要求1至7任一項所述的設備狀態檢測系統。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有計算機可執行指令,所述計算機可執行指令被處理器加載并執行時,實現如權利要求8所述的鏈路超時故障修復方法。
...【技術特征摘要】
1.一種設備狀態檢測系統,其特征在于,包括:中央處理器、基本輸入輸出系統、待測設備及硬件檢測單元,所述中央處理器與所述待測設備通過高速串行計算機擴展總線連接,所述中央處理器與所述基本輸入輸出系統連接,所述基本輸入輸出系統與所述待測設備和所述硬件檢測單元連接,所述硬件檢測單元與所述待測設備連接;
2.根據權利要求1所述的設備狀態檢測系統,其特征在于,所述中央處理器,還用于:
3.根據權利要求1所述的設備狀態檢測系統,其特征在于,所述基本輸入輸出系統,還用于從所述待測設備的狀態寄存器中獲取所述設備狀態;
4.根據權利要求2所述的設備狀態檢測系統,其特征在于,所述待測設備,用于在上電啟動時,獲取自身的內核初始化狀態,并將所述內核初始化狀態寫入所述狀態寄存器;
5.根據權利要求...
【專利技術屬性】
技術研發人員:張國磊,貢維,李巖,王勇,朱慧蓉,
申請(專利權)人:北京森信維計算機科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。