System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機,尤其涉及一種對pcie設備的掉卡檢測方法及bmc。
技術介紹
1、隨著計算設備(例如ai(art?ificia?l?i?nte?l?l?igence,人工智能)服務器和機架式服務器等)的硬件配置的復雜性的增加,對計算設備運行的可維護性的要求也越來越高,其中,對計算設備中所部署的pcie(per?iphera?l?component?i?nterconnectexpress)設備的掉卡檢測受到重點關注。
2、那么,如何提供一種對pcie設備的掉卡檢測方法成為亟待解決的問題。
技術實現思路
1、本申請實施例提供了一種對pcie設備的掉卡檢測方法、裝置、bmc、系統、計算設備、計算機存儲介質及計算機程序產品,能夠實現對計算設備所部署的pcie設備的掉卡檢測。
2、第一方面,本申請實施例提供一種對pcie設備的掉卡檢測方法,所述方法包括:
3、確定第一pcie設備的地址信息,所述地址信息是在計算設備的啟動階段通過bios獲取的,所述第一pcie設備部署于所述計算設備;
4、基于所述地址信息,獲取所述地址信息下的設備標識;
5、若所述獲取失敗,則確定所述第一pcie設備掉卡;
6、若所述獲取成功,將所述設備標識與預存標識進行比對,確定所述第一pcie設備是否掉卡;所述預存標識與所述地址信息具有預設對應關系。
7、上述過程中,在計算設備完成啟動之后,可以從在計算設備的啟動階段通過bios獲取的
8、在一些可能的實施方式中,所述設備標識包括所述第一pcie設備的廠商id和/或設備id。該示例中,設備標識包括第一pcie設備的廠商id和/或設備id這類可以唯一確定相應的第一pcie設備的標識,基于該類標識確定第一pcie設備是否掉卡,可以在一定程度上提高掉卡檢測結果的準確性。
9、在一些可能的實施方式中,所述預存標識,是所述計算設備的啟動階段通過bios,對所述計算設備部署的pcie設備進行枚舉過程中所獲取并存儲的;或者,是所述計算設備配置完成各pcie設備后被配置存儲的。
10、上述示例中,計算設備在啟動階段通過運行的bios枚舉到第一pcie設備的預存標識,說明枚舉時第一pcie設備處于未掉卡的狀態,通過該類預存標識,可以更方便、準確地實現計算設備在運行過程中對其pcie設備的掉卡檢測。另外,計算設備配置完成各pcie設備后,計算設備的各pcie設備確定,這時配置存儲第一pcie設備的預存標識,也可以更方便、準確地實現計算設備在運行過程中對其pcie設備的掉卡檢測。
11、在一些可能的實施方式中,所述確定所述第一pcie設備是否掉卡,包括:若所述設備標識與預存標識的比對結果,指示所述設備標識和所述預存標識不一致,則確定所述第一pcie設備掉卡。該示例中,若比對結果指示設備標識和預存標識不一致,則可以確定基于第一pcie設備的地址信息未訪問到第一pcie設備,相應的,確定第一pcie設備掉卡,以實現在計算設備完成啟動后的運行過程中,對計算設備的pcie設備的掉卡檢測,并且,可以確定出相對準確的掉卡檢測結果。
12、在一些可能的實施方式中,還包括:發送第一告警信息,所述第一告警信息指示所述第一pcie設備掉卡。該示例中,在確定第一pcie設備掉卡之后,發送用于指示第一pcie設備掉卡的第一告警信息,以提醒用戶第一pcie設備掉卡,以便其對該第一pcie設備的掉卡情況進行干預,例如執行維修等操作,避免影響計算設備的運行和業務實施。
13、在一些可能的實施方式中,還包括:若所述比對結果指示所述設備標識與所述預存標識一致,確定所述第一pcie設備未掉卡。該示例中,若比對結果指示設備標識和預存標識一致,則確定基于第一pcie設備的地址信息訪問到該第一pcie設備,相應的,確定第一pcie設備未掉卡,以實現在計算設備完成啟動后的運行過程中,對計算設備的pcie設備的掉卡檢測,并且,可以確定出相對準確的掉卡檢測結果。
14、在一些可能的實施方式中,還包括:在確定所述第一pcie設備未掉卡的情況下,判斷所述第一pcie設備在前一次掉卡檢測周期內是否被檢測為掉卡;若判斷為是,則發送第二告警信息,所述第二告警信息指示所述第一pcie設備掉卡恢復。該示例性,第一pcie設備在前一次掉卡檢測周期內被檢測為掉卡,而本次掉卡檢測被確定為未掉卡,在一定程度上可以說明經用戶干預,第一pcie設備的掉卡情況被修復,發送用于指示第一pcie設備掉卡恢復的第二告警信息,以供用戶知曉具體情況。
15、在一些可能的實施方式中,所述計算設備部署第一模組,其中,所述第一模組包括指定數量的pcie設備;在所述確定第一pcie設備的地址信息之前,還包括:確定通過所述bios所枚舉到的若干pcie設備的地址信息及其各自對應的標識,所述若干pcie設備部署于所述計算設備;獲取所述第一模組中各pcie設備的標識;若基于所述第一模組中各pcie設備的標識,以及通過bios所枚舉到的所述若干pcie設備的地址信息各自對應的標識,確定所述若干pcie設備的地址信息中不包括所述第一模組中的第二pcie設備的地址信息,發送第三告警信息,所述第三告警信息指示所述第二pcie設備掉卡。該示例中,可以實現對模組內的pcie設備的掉卡的檢測,以便用戶對模組內的pcie設備的工作狀態的確定。
16、在一些可能的實施方式中,所述基于所述地址信息,獲取所述地址信息下的設備標識,包括:通過管理引擎me,基于所述地址信息,獲取所述設備標識。該示例中,提供了一種在計算設備的操作系統運行過程中,獲取第一pcie設備的地址信息下的設備標識的實現方案,為在計算設備的操作系統運行過程中,對計算設備的pcie設備的掉卡檢測提供了基礎。
17、在一些可能的實施方式中,所述方法應用于bmc,所述bmc用于管理所述計算設備;所述通過運行的管理引擎me,基于所述地址信息,獲取所述設備標識,包括:所述bmc將所述地址信息發送至所述計算設備,以使所述計算設備通過運行的管理引擎me,基于所述地址信息,獲取所述設備標識;獲取所述計算設備發送本文檔來自技高網...
【技術保護點】
1.一種對PCIe設備的掉卡檢測方法,其特征在于,所述方法包括:
2.如權利要求1所述的方法,其特征在于,所述設備標識包括所述第一PCIe設備的廠商ID和/或設備ID。
3.如權利要求1所述的方法,其特征在于,所述預存標識,是所述計算設備的啟動階段通過BIOS對所述計算設備部署的PCIe設備進行枚舉過程中所獲取并存儲的;或者,是所述計算設備配置完成各PCIe設備后被配置存儲的。
4.如權利要求1所述的方法,其特征在于,所述確定所述第一PCIe設備是否掉卡,包括:
5.如權利要求4所述的方法,其特征在于,還包括:
6.如權利要求4所述的方法,其特征在于,還包括:
7.如權利要求6所述的方法,其特征在于,還包括:
8.如權利要求1-7任一項所述的方法,其特征在于,所述計算設備部署第一模組,其中,所述第一模組包括指定數量的PCIe設備;
9.如權利要求1-7任一項所述的方法,其特征在于,所述基于所述地址信息,獲取所述地址信息下的設備標識,包括:
10.一種基板管理控制器BMC,其
...【技術特征摘要】
1.一種對pcie設備的掉卡檢測方法,其特征在于,所述方法包括:
2.如權利要求1所述的方法,其特征在于,所述設備標識包括所述第一pcie設備的廠商id和/或設備id。
3.如權利要求1所述的方法,其特征在于,所述預存標識,是所述計算設備的啟動階段通過bios對所述計算設備部署的pcie設備進行枚舉過程中所獲取并存儲的;或者,是所述計算設備配置完成各pcie設備后被配置存儲的。
4.如權利要求1所述的方法,其特征在于,所述確定所述第一pcie設備是否掉卡,包括:
5.如權利要...
【專利技術屬性】
技術研發人員:陸小木,
申請(專利權)人:超聚變數字技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。