服務器數據恢復環境:
華為OceanStor某型號存儲,十幾塊FC硬盤組建一組RAID5磁盤陣列,配備了一塊熱備盤;上層使用EXT3文件系統,配置了oracle數據庫。
服務器故障:
該存儲RAID5中的一塊硬盤未知原因離線,熱備盤上線開始同步數據,同步未完成時候又有一塊磁盤未知原因離線,數據同步失敗,raid5癱瘓,上層lun不可用。
服務器數據恢復過程:
1、將故障存儲中所有磁盤編號后取出進行物理故障檢測,檢測后發現為先掉線的磁盤存在物理故障,其他磁盤包括后掉線的那塊磁盤均無物理故障。
2、將所有磁盤以只讀方式做全盤鏡像,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次影響。
3、基于鏡像文件分析raid5中的所有磁盤底層數據,找出熱備盤。raid是條帶化的,陣列中的數據是按照一定的規律進行存儲的。數據恢復工程師分析raid中的數據庫頁在每一個物理磁盤中的分布情況,計算出raid5的磁盤順序、數據走向、條帶大小等RAID相關信息。
4、根據分析出來的RAID相關信息,使用北亞企安自主開發的RAID重構程序將原始RAID虛擬重構出來。但由于原始RAID5中掉線了2塊盤且有1塊盤的數據被同步破壞,分析每一塊硬盤中的數據后發現有一塊硬盤在同一個條帶上的數據和其他硬盤明顯不一致,初步判斷此盤是被同步破壞的硬盤。通過北亞企安自主開發的RAID校驗程序校驗這個條帶,最終確定被同步損壞的磁盤。
5、分析lun在raid5中的分配狀態和lun分配的數據塊,根據數據MAP導出LUN的數據。
6、由于使用了熱備盤虛擬重構RAID,EXT3文件系統無法正常掛載。
7、提取oracle數據庫文件,使用北亞企安自主開發的文件系統解析程序對其進行文件系統解析,然后導出oracle數據庫文件。
8、將導出的數據庫文件移交給數據庫工程師進行校驗和驗證。使用Oracle數據庫文件檢測工具檢測每個數據庫文件的完整性。如果發現錯誤,使用北亞企安自主研發的Oracle數據庫檢測工具進行二次檢測。檢測后發現部分數據庫文件和日志文件錯誤,system和sysaux表空間都存在壞塊,控制文件全部損壞;eschoolspace表空間的幾個文件存在的壞塊更多;undotbs02丟失;數據庫數據恢復工程師對這些文件進行修復。
北亞企安數據恢復——OceanStor存儲數據恢復
北亞企安數據恢復——OceanStor存儲數據恢復
北亞企安數據恢復——OceanStor存儲數據恢復
9、修復完成后,由用戶方配合,啟動Oracle數據庫。在本地虛擬機安裝OA客戶端,通過OA客戶端對數據記錄進行驗證。用戶方安排不同部門人員進行遠程驗證,經過反復驗證,確認數據完整有效。本次數據恢復工作完成。
審核編輯:湯梓紅
-
華為
+關注
關注
215文章
34128瀏覽量
249469 -
存儲
+關注
關注
13文章
4123瀏覽量
85279 -
數據恢復
+關注
關注
10文章
507瀏覽量
17204 -
磁盤
+關注
關注
1文章
355瀏覽量
25095
發布評論請先 登錄
相關推薦
評論