服務器數據恢復環境:
5臺服務器節點,每臺服務器節點配置一組RAID5,每組6塊硬盤,其中1塊設置為熱備盤。
系統環境為Lustre分布式文件系統,5臺服務器共同存儲全部的數據文件。
服務器故障&檢測:
機房漏水導致服務器進水,服務器中的部分硬盤損壞。每組服務器有2塊及以上的盤掉線。由于短時間同時掉線2塊及以上硬盤導致RAID5崩潰,服務器,數據無法正常讀取。
服務器數據恢復過程:
1、為避免對原盤數據造成二次破壞,使用工具對故障服務器中所有正常硬盤進行鏡像備份。后續操作全部基于鏡像完成。
2、通過更換磁頭、修復固件等方式修復無法讀取的故障硬盤,并鏡像故障硬盤中的數據。
3、北亞數據恢復工程師通過分析磁盤中數據規律獲取到RAID校驗形式、條帶大小、盤序等RAID相關信息,并根據這些RAID信息虛擬重組出所有RAID整列。
4、解析Lustre分布式文件系統。
Lustre分布式系統由元數據卷(MDS)和數據卷(OST)組成,重組RAID后就可以看到MDS分區和OST分區。Lustre文件系統中所有文件的文件名、文件路徑等屬性信息存放在MDS分區,而文件對應的數據內容全部存放在OST分區中。
MDS分區是一個EXT3文件系統,除了節點類型為文件的解析方式有所變化外,其余所有解析方式和Ext3一樣。
從MDS中獲取到整個Lustre中所有文件的目錄結構,文件名稱,文件編號,所屬OST號等屬性信息。
根據從MDS中獲取到的目錄結構,文件名稱,文件編號,所屬OST號等屬性信息,北亞數據恢復工程師整理重構出文件的原始路徑,并定位到索引的OST卷及相關數據區域,獲取相關數據文件。
5、通過萬兆網絡將恢復出的所有數據拷貝到用戶準備好的設備環境中。
服務器數據恢復結果:
用戶親自檢查恢復出來的數據,確認數據文件基本全部恢復出來,隨機抽取部分文件進行校驗,文件正確無誤,目錄結構完好。本次數據恢復完成。
審核編輯:湯梓紅
-
服務器
+關注
關注
12文章
9024瀏覽量
85186 -
數據恢復
+關注
關注
10文章
550瀏覽量
17390
發布評論請先 登錄
相關推薦
評論