System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于嵌入式系統,尤其涉及一種操作系統處理硬件異常的智能方法和裝置。
技術介紹
1、基礎軟件操作系統作為所有應用軟件的基礎,成為國內研究的重點,系統的穩定性更是重中之重。系統的穩定主要體現在硬件或軟件錯誤發生時,操作系統的自愈能力。
2、在多核場景下,整個過程會比較復雜,如某條總線節點上出現了錯誤,總線控制器把這個錯誤通過axi接口以中斷方式報告給cpu,中斷是經過中斷子系統上報給處理中斷的cpu,在中斷上報沒有生效前,錯誤的結果可能已經被另外一個cpu獲取,并根據錯誤的結果進行了處理,這個錯誤的傳播與處理是異步進行的,結果必然導致系統狀態未知。為了防止錯誤擴散,硬件根據錯誤上報的傳播范圍,對錯誤進行了非常復雜的分類。linux系統為社區愛好者開發,非商用目的,所以處理這些錯誤時化繁為簡,僅將錯誤分類為兩種:ce(可以修正的錯誤)和ue(不能修正的錯誤)。linux內核檢測到錯誤是ce的,這種錯誤可以被主動修復,通常不影響系統穩定;若系統檢測到錯誤不是ue的就麻煩了,這時系統就會宕機。
3、傳統linux操作系統將硬件異常簡單分為可恢復和不可恢復兩種情況,這種劃分過于粗泛,不利于對故障進行差異化處理,增加了系統不穩定因素;實際上不可恢復的系統錯誤也存在不同狀態,有些硬件異常發生概率小,且異常出現后對系統穩定沒有影響,這種錯誤可能一個月發生一次,也可能一年發生一次。顯然、所有的不可恢復系統錯誤采用統一的處理方式不利于系統穩定。對內核來說,系統錯誤是硬件存在故障所致,內核不知道具體原因,也不知道如何修
技術實現思路
1、針對現有技術存在的不足,本專利技術實施例提供了一種操作系統處理硬件異常的智能方法和裝置,利用操作系統硬件異常存在的多樣性特點,通過異常特征碼(afc)對操作系統硬件異常進行精準的定位和細分,采用異常特征池(stl)的智能學習,訓練進化異常的處理策略,解決了現有技術中因將操作系統中硬件異常進行簡單、粗泛劃分分類,對異常問題粗暴處理導致硬件故障無限放大,進而使得操作系統宕機的概率大增的問題,從而達到提升系統穩定性和可用性的效果。
2、本專利技術實施例的一方面是:提供一種操作系統處理硬件異常的智能方法,所述方法包括:
3、在操作系統上部署一套異常智能處理裝置,操作系統啟動時,異常智能處理裝置會自動部署在操作系統的各個業務板卡中,從操作系統各個業務板卡中獲取異常特征碼;
4、初始化操作系統保留內存,在保留的內存中構建各業務板卡的異常特征池,并在構建的異常特征池中創建接收線程和發送線程;
5、將獲取的單個業務板卡的異常特征碼歸集到對應的異常特征池中,智能處理裝置對異常特征池進行自動訓練學習,生成當前異常特征碼的異常處理策略及異常狀態;
6、通過異常處理策略處理當前異常,同時,將完成訓練學習后的異常特征池通過收發線程與相鄰業務板卡完成訓練學習后的異常特征池進行異常特征碼、異常處理策略及異常狀態同步,并存儲到非易失存儲介質中,作為靜態資源;
7、各業務板卡訓練學習后的異常特征池通過接收線程和發送線程對系統進行周期性輪詢檢測是否有異常發生,基于檢測結果完成相鄰業務板卡異常特征池的共享、異常處理以及靜態資源的更新操作。
8、本專利技術實施例的另一方面是:提供一種操作系統處理硬件異常的裝置,所述裝置包括:異常處理模塊和異常智能學習模塊,其中:
9、所述異常處理模塊,還包括異常特征碼計算單元、異常處理策略單元和異常錯誤特征池單元,主要用于當系統發生異常時進行異常處理;
10、進一步的,所述異常特征碼計算單元,用于將獲取的系統異常信息計算出異常特征碼;所述異常處理策略單元,用于根據異常特征碼對應的異常特征池的異常處理策略進行異常處理;所述異常錯誤特征池單元,用于根據系統出現的異常信息,將異常特征碼實時更新納入到異常特征池中,并擴充異常特征池空間。
11、所述異常智能學習模塊,用于異常特征碼的發送和接收,并對異常特征池進行自動訓練學習,生成異常處理策略;
12、進一步的,所述對異常特征池進行自動訓練學習,具體是通過發送線程周期性的輪詢檢測異常特征池中是否有異常發生,若有異常則說明異常特征池有更新,刷新本地異常特征池并同步刷新非易失存儲介質中的靜態特征碼和處理策略。
13、現有技術相比,本專利技術存在以下優點:
14、1、本專利技術利用硬件和系統異常存在多樣性的特點,通過異常特征碼對硬件系統異常進行精確定位和細分,通過異常特征池的智能學習,訓練進化異常的處理策略,從而達到提升系統穩定性和可用性的效果,解決了傳統內核對于不可恢復硬件錯誤的粗泛分類和粗暴處理方法;
15、2、本專利技術通過異常特征碼鎖定硬件故障,通過訓練和自動學習,不斷完善異常特征池,實現硬件故障更加精細化的識別和處理,同時通過異常特征碼對硬件錯誤進行的引流,將錯誤進行分流,使得硬件故障對系統穩定性的破壞降到了最低,使得系統對硬件故障和軟件錯誤的抵抗能力顯著增強,可有效降低操作系統異常宕機問題。
16、本專利技術的其它特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本專利技術而了解。本專利技術的目的和其他優點可通過在說明書、權利要求書以及附圖中所指出的結構來實現和獲得。
本文檔來自技高網...【技術保護點】
1.一種操作系統處理硬件異常的智能方法,其特征在于:
2.如權利要求1所述的一種操作系統處理硬件異常的智能方法,其特征在于:
3.如權利要求1所述的一種操作系統處理硬件異常的智能方法,其特征在于:
4.如權利要求3所述的一種操作系統處理硬件異常的智能方法,其特征在于:
5.如權利要求1所述的一種操作系統處理硬件異常的智能方法,其特征在于,所述各業務板卡訓練學習后的異常特征池通過接收線程和發送線程對操作系統進行周期性輪詢檢測是否有異常發生,基于檢測結果完成相鄰業務板卡異常特征池的共享、異常處理以及靜態資源的更新操作,其中:
6.如權利要求5所述的一種操作系統處理硬件異常的智能方法,其特征在于,所述將共享后的異常特征池與靜態資源中的異常特征池進行比對,基于比對結果進行異常處理以及靜態資源的更新操作,具體為:
7.如權利要求6所述的一種操作系統處理硬件異常的智能方法,其特征在于,所述基于異常池幀中的秘匙,判斷是否與靜態資源中的異常特征池中的秘匙一致,根據判斷結果進行異常處理以及靜態資源的更新操作;還包括:
< ...【技術特征摘要】
1.一種操作系統處理硬件異常的智能方法,其特征在于:
2.如權利要求1所述的一種操作系統處理硬件異常的智能方法,其特征在于:
3.如權利要求1所述的一種操作系統處理硬件異常的智能方法,其特征在于:
4.如權利要求3所述的一種操作系統處理硬件異常的智能方法,其特征在于:
5.如權利要求1所述的一種操作系統處理硬件異常的智能方法,其特征在于,所述各業務板卡訓練學習后的異常特征池通過接收線程和發送線程對操作系統進行周期性輪詢檢測是否有異常發生,基于檢測結果完成相鄰業務板卡異常特征池的共享、異常處理以及靜態資源的更新操作,其中:
6.如權利要求5所...
【專利技術屬性】
技術研發人員:劉勇剛,鄭遠,劉偉燦,
申請(專利權)人:烽火通信科技股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。