服務器數據恢復環境:
IBM某型號服務器中6塊硬盤搭建的raid5磁盤陣列,其中1塊盤作為熱備盤使用。
服務器故障&檢測:
服務器中RAID5磁盤陣列中的1塊盤出現故障離線,熱備盤激活替換離線硬盤,在進行數據同步的過程中又有一塊硬盤故障離線,RAID5磁盤陣列癱瘓,上層LUN不可用,服務器崩潰。
IBM服務器中的LUN是基于RAID組的。分析故障raid5中的所有硬盤,發現其中一塊盤的數據同其它盤有明顯不同,初步判斷這塊盤就是HotSpare盤。分析其他盤以及Oracle數據庫頁在每個磁盤中的分布情況,獲取到該RAID5的條帶大小、磁盤順序及數據走向等RAID相關信息。利用獲取到的raid相關信息虛擬重構RAID5,然后分析LUN在RAID5中的分配情況以及LUN分配的數據塊MAP。只需要將LUN的數據塊分布MAP提取出來,針對這些信息編寫相應的程序,解析LUN的數據MAP,然后根據數據MAP導出LUN的數據即可恢復數據。
服務器數據恢復過程:
一、恢復Oracle數據庫數據。
1、將包含Oracle數據庫數據的LUN進行JFS2文件系統解析,人工修復文件系統的不完整部分。
2、利用北亞企安自主開發的JFS2文件系統解析工具解析修復完成的LUN,然后恢復文件系統中所有的Oracle數據庫文件。
3、檢測Oracle數據庫文件的完整性。針對檢測有壞塊的數據庫文件,通過掃描所有硬盤找到所有Oracle碎片,組合掃描到的數據頁,人工將有壞塊的數據庫文件修復完整。
4、恢復完所有Oracle數據庫之后,發現SAP應用還是無法正常使用。經過分析發現SAP應用的一些重要數據也是存放在損壞的存儲中,如果沒有這些重要的數據,即使在Oracle數據庫完整的情況下SAP應用也無法正常使用。
二、恢復SAP應用數據。
1、對恢復出來的所有LUN都進行文件系統解析,將包含SAP應用數據的LUN進行文件系統的一致性檢測。人工修復文件系統不完整部分,直至恢復出所有SAP及SAP Test的數據。
2、檢測恢復出來的SAP應用數據,對損壞的SAP應用數據進行修復,直至所有SAP數據都完整,只有這樣才能保證SAP應用能夠正常使用。
3、SAP數據修復完成后,結合之前恢復出來的Oracle數據庫,即可啟動SAP應用了。
三、啟動并修復Oracle數據庫及SAP應用
1、啟動數據庫并修復。
把恢復的Oracle數據庫文件還原到已搭建好的環境中,并嘗試啟動Oracle數據庫。在啟動過程中由于數據庫一些臨時文件的校驗不一致導致數據庫啟動失敗。聯系Oracle數據庫工程師對數據庫進行修復,修復完成后Oracle數據庫啟動成功,經過反復驗證確認數據庫中的所有用戶及所有表均完整,然后嘗試啟動SAP。
2、啟動SAP并修復。
將恢復出來的SAP數據還原到已搭建好的環境中并啟動SAP,SAP啟動正常,但SAP中的用戶權限及使用異常,SAP表現為沒有序列號。北亞企安數據恢復工程師初步判斷是因為SAP的注冊文件沒有恢復出來。重新檢測恢復過程,排查可能疏忽的地方,結果發現確實因為文件系統損壞導致某些文件沒有恢復出來。重新修復文件系統并恢復這些數據,然后啟動并檢查SAP,結果一切正常。
3、在用戶方工程師配合下啟動服務器內的Oracle數據庫和SAP,通過SAP客戶端反復驗證SAP中所有的數據,沒有發現任何問題,恢復出來的數據完整可用。本次數據恢復任務完成。
審核編輯:湯梓紅
-
服務器
+關注
關注
12文章
9021瀏覽量
85184 -
數據恢復
+關注
關注
10文章
549瀏覽量
17390 -
磁盤
+關注
關注
1文章
367瀏覽量
25177 -
RAID5
+關注
關注
0文章
112瀏覽量
12705
發布評論請先 登錄
相關推薦
評論