本發(fā)明專利技術(shù)涉及在軟件部署中進(jìn)行故障管理的方法和系統(tǒng)。具體地,本發(fā)明專利技術(shù)提供了一種向目標(biāo)機(jī)器的操作系統(tǒng)部署期間進(jìn)行故障管理故障的方法,所述操作系統(tǒng)部署包括:運(yùn)行漸進(jìn)的硬件發(fā)現(xiàn)以捕獲與目標(biāo)機(jī)器有關(guān)的清單信息,以及將所述清單信息存儲在清單數(shù)據(jù)存儲庫中。該方法包括:監(jiān)控OS部署以在預(yù)定持續(xù)時間內(nèi)檢測預(yù)OS環(huán)境中的操作系統(tǒng)部署中的故障;響應(yīng)于該預(yù)定持續(xù)時間到期而發(fā)出故障監(jiān)控完成通知;確定在監(jiān)控操作系統(tǒng)部署的步驟期間是否已經(jīng)生成了故障代碼;如果檢測到故障代碼,則使用該故障代碼和清單信息來從補(bǔ)救存儲庫確定與BIOS有關(guān)的補(bǔ)救措施,并且執(zhí)行該補(bǔ)救措施。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)總體上涉及計算機(jī)系統(tǒng)管理,并且具體地涉及管理軟件部署中的故障的方法和系統(tǒng)。
技術(shù)介紹
隨著現(xiàn)代計算機(jī)系統(tǒng)復(fù)雜性的增加,需要改善對軟件部署的管理。軟件部署管理涉及按照特定順序的多個管理任務(wù),直到完成軟件安裝為止。然而,在部署軟件的過程中, 可能發(fā)生錯誤或故障。特別是因?yàn)榘l(fā)生在執(zhí)行給定任務(wù)期間的錯誤可能影響其他任務(wù)的執(zhí)行,因此監(jiān)控這種錯誤是重要的挑戰(zhàn)。在向目標(biāo)機(jī)器部署操作系統(tǒng)期間進(jìn)行故障管理更具挑戰(zhàn),因?yàn)槟繕?biāo)機(jī)器在部署操作系統(tǒng)之前具有非常有限的能力。US 2008/0077935提供了如下解決方案,該解決方案用于在執(zhí)行系統(tǒng)管理流時,使用工作流引擎與該工作流引擎所調(diào)用的任務(wù)之間的標(biāo)準(zhǔn)協(xié)議來處理可解決的和不可解決的錯誤。然而,這一方法是靜態(tài)的,并且需要來自管理員的人工干預(yù)來補(bǔ)救故障。進(jìn)一步, 該方法不允許處理目標(biāo)機(jī)器上的遠(yuǎn)程控制的軟件安裝中的錯誤。因此,該方法不適于在操作系統(tǒng)部署期間或在復(fù)雜的服務(wù)器級系統(tǒng)中自動地管理故障。
技術(shù)實(shí)現(xiàn)思路
為了解決這些和其他問題,提供了根據(jù)所附獨(dú)立權(quán)利要求1的、處理目標(biāo)數(shù)字設(shè)備上的遠(yuǎn)程控制的軟件安裝中的錯誤的方法,以及分別根據(jù)所附權(quán)利要求11、12和13的計算機(jī)程序、計算機(jī)可讀介質(zhì)以及系統(tǒng)。在所附從屬權(quán)利要求中限定了優(yōu)選實(shí)施方式。本專利技術(shù)相應(yīng)地提供了用于特別是在復(fù)雜的/差別化的服務(wù)器級環(huán)境中處理遠(yuǎn)程操作系統(tǒng)(OS)部署中的錯誤的有效的解決方案。本專利技術(shù)進(jìn)一步提供并利用了向服務(wù)器發(fā)送的清單(inventory)信息(硬件細(xì)節(jié)、 BIOS等級、DASD-直接存取存儲設(shè)備接口細(xì)節(jié)),其有助于在服務(wù)器側(cè)識別正確的補(bǔ)救措施。本專利技術(shù)的另一優(yōu)點(diǎn)是對可能發(fā)生在所考慮的環(huán)境中的掛起情形進(jìn)行補(bǔ)救。在計算系統(tǒng)(諸如個人計算機(jī)或服務(wù)器)中,在單個計算機(jī)程序或整個系統(tǒng)未能對用戶輸入(例如鍵盤和鼠標(biāo)輸入、或者利用控制設(shè)備輸入鍵入的其他命令)進(jìn)行響應(yīng)時,發(fā)生掛起或凍結(jié)。根據(jù)本專利技術(shù)的實(shí)施方式,可以通過在網(wǎng)卡中利用帶外(out-of-boimd)通信、強(qiáng)制遠(yuǎn)程重新引導(dǎo),來解決由服務(wù)器檢測到的掛起狀況。然后,這使得可以自動恢復(fù)操作系統(tǒng)(OS) 部署流。本專利技術(shù)還使得能夠用在將要在所述預(yù)OS環(huán)境中運(yùn)行的BIOS和1/0驅(qū)動器接口上的測試套件來仿真真實(shí)的行為。與限于靜態(tài)查看的現(xiàn)有技術(shù)文獻(xiàn)不同,本專利技術(shù)的進(jìn)一步優(yōu)點(diǎn)是處理如下場景在操作系統(tǒng)(OS)設(shè)置場景期間,目標(biāo)故障被漸進(jìn)發(fā)現(xiàn),并且需要響應(yīng)于檢測到引導(dǎo)故障并根據(jù)硬件清單和癥狀目錄,例如利用自動的BIOS刷新或其他的固件更新或重新配置,來動態(tài)地解決該目標(biāo)故障。在研究附圖和詳細(xì)描述后,本專利技術(shù)的進(jìn)一步優(yōu)點(diǎn)對于本領(lǐng)域技術(shù)人員將變得清楚。旨在將任何附加的優(yōu)點(diǎn)都包含在其中。附圖說明現(xiàn)在將參考附圖、通過示例的方式描述本專利技術(shù)的實(shí)施方式,其中相似的參考標(biāo)號表示類似的元件,并且其中圖1示意性地圖示了操作系統(tǒng)部署(OSD)內(nèi)核與執(zhí)行I/O操作的I/O驅(qū)動器之間的交互;圖2示意性地示出了用于實(shí)現(xiàn)操作系統(tǒng)部署的示例性架構(gòu);圖3示出了根據(jù)本專利技術(shù)特定實(shí)施方式的故障管理系統(tǒng);圖4A和圖4B表示在OS部署的硬件發(fā)現(xiàn)階段期間捕獲的示例性清單數(shù)據(jù);圖5示出了用于OS部署的流程圖;以及圖6示出了用于OS部署期間的故障管理的流程圖。具體實(shí)施例方式根據(jù)本專利技術(shù)的特定實(shí)施方式,提供了一種用于自動地管理對目標(biāo)機(jī)器的操作系統(tǒng)部署期間的故障的方法。目標(biāo)機(jī)器可以是任何類型的計算機(jī)機(jī)器或系統(tǒng),無論是物理的還是虛擬的(例如工作站、移動/手持設(shè)備等)。本專利技術(shù)可以應(yīng)用于對具有客戶端庫的增強(qiáng)型瀏覽器、或管理程序、或虛擬機(jī)、或其組合的按需的或?qū)崟r的安裝中的故障管理。通常緊接在引導(dǎo)之后從系統(tǒng)存儲器加載和執(zhí)行操作系統(tǒng)。預(yù)OS引導(dǎo)用于在加載和執(zhí)行操作系統(tǒng)之前引導(dǎo)計算機(jī)系統(tǒng)。在預(yù)OS環(huán)境期間,計算機(jī)系統(tǒng)能力是有限的,這提供有限的資源來監(jiān)控OS部署故障。為便于理解本專利技術(shù),下面是在特定優(yōu)選實(shí)施方式的詳細(xì)描述中使用的特定表達(dá)的定義巡表示操作系統(tǒng)。OSD表示操作系統(tǒng)部署。操作系統(tǒng)(OS)表示管理計算設(shè)備的硬件和軟件的軟件,該計算設(shè)備諸如智能電話、計算機(jī)、手持計算機(jī)、臺式計算機(jī)、膝上型計算機(jī)、超級計算機(jī)、視頻游戲控制臺、機(jī)器人、如洗碗機(jī)或洗衣機(jī)之類的家用電器、便攜式媒體播放器等。操作系統(tǒng)向應(yīng)用程序和用戶提供多個服務(wù)。應(yīng)用通過應(yīng)用編程接口(API)或系統(tǒng)調(diào)用來訪問這些服務(wù)。常見的當(dāng)代操作系統(tǒng)包括AIX或Linux。NTFS是Microsoft Windows系統(tǒng)的標(biāo)準(zhǔn)文件系統(tǒng)。10(或I/O)代表“輸入/輸出”,并且表示信息處理系統(tǒng)的不同的功能性單元用來彼此通信的接口集合。_代表基本輸入/輸出系統(tǒng),其是限定引導(dǎo)固件的事實(shí)上的標(biāo)準(zhǔn)。BIOS的功能是識別、測試和初始化系統(tǒng)設(shè)備,諸如視頻顯卡、硬盤、軟盤、以及其他硬件。BIOS將機(jī)器準(zhǔn)備為已知狀態(tài),從而使得存儲在兼容介質(zhì)上的軟件能夠被加載、執(zhí)行對計算機(jī)給出控制。大多數(shù)時候,BIOS程序存儲在芯片上。某些組件攜帶其自身的BIOS擴(kuò)展R0M,該ROM提供附加的功能性。操作系統(tǒng)和軟件取代這些基本的功能性并向應(yīng)用提供替代軟件接口。當(dāng)存儲在可重寫存儲器中時,刷新BIOS表示用BIOS映像重寫B(tài)IOS內(nèi)容的處理。將BIOS更新到較新版本以修復(fù)特定缺陷(bug),用以支持較新的硬件,或者用以修復(fù)受損的BIOS。如果沒有正確地進(jìn)行操作,則其可能致使系統(tǒng)不可操作。■(或EFI或UEFI)是“(統(tǒng)一)可擴(kuò)展固件接口”的縮寫,其是定義操作系統(tǒng)與平臺固件之間的軟件接口的規(guī)范。EFI是計算機(jī)中存在的BIOS固件接口的大得多的、更復(fù)雜的、類OS的替代。EFI規(guī)范由統(tǒng)一 EFI論壇管理。PXE是指“預(yù)引導(dǎo)執(zhí)行環(huán)境”并且又稱為預(yù)執(zhí)行環(huán)境或“pixie”。其表示用以使用獨(dú)立于可用數(shù)據(jù)存儲設(shè)備(諸如硬盤)或所安裝的操作系統(tǒng)的網(wǎng)絡(luò)接口來引導(dǎo)計算機(jī)(客戶端或服務(wù)器)的環(huán)境。PXE利用若干網(wǎng)絡(luò)協(xié)議,如網(wǎng)際協(xié)議(IP)、用戶數(shù)據(jù)報協(xié)議(UDP)、 動態(tài)主機(jī)配置協(xié)議(DHCP)以及小文件傳輸協(xié)議(TFTP),并且利用多個概念,如全球唯一標(biāo)識符(⑶ID)、通用唯一標(biāo)識符(UUID)以及通用網(wǎng)絡(luò)設(shè)備接口。其利用一組預(yù)定應(yīng)用編程接口(API)來擴(kuò)展PXE客戶端(有待經(jīng)由PXE引導(dǎo)裝入(bootstrap)的計算機(jī))的固件。 術(shù)語PXE客戶端僅僅是指機(jī)器在PXE引導(dǎo)處理中所承擔(dān)的角色。PXE客戶端可以是配備有 PXE引導(dǎo)代碼的服務(wù)器、臺式機(jī)、膝上型計算機(jī)或者任何其他機(jī)器。WINPE表示“Windows預(yù)安裝環(huán)境”,其是用于部署工作站和服務(wù)器的某些Windows 系統(tǒng)的輕量級版本。其是在Windows安裝階段期間MS-DOS的替代,并且能夠經(jīng)由PXE或存儲設(shè)備來引導(dǎo)。對于Windows的部署,可以使用微軟公司的Windows ΡΕ。對于Linux的部署,可以使用IBM的MCP Linux環(huán)境。設(shè)置管理器是指設(shè)置管理器系統(tǒng),諸如TPMfOSD (用于操作系統(tǒng)部署的Tivoli設(shè)置管理器)。Tivoli是IBM公司的商標(biāo)。盡管描述利用TPMfOSD提供了示例,但應(yīng)當(dāng)理解, 本專利技術(shù)的實(shí)施方式不限于這一特定環(huán)境。用于遠(yuǎn)程地管理裸機(jī)目標(biāo)(例如個人計算機(jī))上的OS安裝和部署的系統(tǒng)通常以無人管理的方式與遠(yuǎn)程機(jī)器交互(通過其BIOS),從而加載預(yù)引導(dǎo)微型OS環(huán)境(例如網(wǎng)絡(luò)本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種在向目標(biāo)機(jī)器的操作系統(tǒng)部署中進(jìn)行故障管理的方法,所述操作系統(tǒng)部署包括運(yùn)行漸進(jìn)的硬件發(fā)現(xiàn),以捕獲與所述目標(biāo)機(jī)器有關(guān)的清單信息,以及將所述清單信息存儲在清單數(shù)據(jù)存儲庫中,其中所述方法包括:a-監(jiān)控所述操作系統(tǒng)部署以在預(yù)定持續(xù)時間內(nèi)檢測預(yù)操作系統(tǒng)環(huán)境中的操作系統(tǒng)部署中的故障,b-響應(yīng)于所述預(yù)定持續(xù)時間到期而發(fā)出故障監(jiān)控完成通知,c-確定在所述監(jiān)控所述操作系統(tǒng)部署的步驟期間是否已經(jīng)生成了故障代碼,以及d-如果在步驟c中檢測到故障代碼,則使用所述故障代碼和所述清單信息,來確定與BIOS有關(guān)的至少一個補(bǔ)救措施,并且執(zhí)行所述至少一個補(bǔ)救措施。
【技術(shù)特征摘要】
...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:L·皮徹蒂,A·佩羅尼,C·馬里內(nèi)利,R·薩勒姆,
申請(專利權(quán))人:國際商業(yè)機(jī)器公司,
類型:發(fā)明
國別省市:US
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。