服務器數據恢復環境&故障:
由于機房多次斷電導致一臺服務器中raid陣列信息丟失。該陣列中存放的是文檔,上層安裝的是Windows server操作系統,沒有配置ups。
因為服務器異常斷電重啟后,raid陣列可以正常使用,所以未引起管理員的注意。后續出現的多次異常斷電導致raid報錯,服務器無法找到存儲設備,進入raid管理模塊進行任何操作都會導致操作系統死機。管理員嘗試多次重啟服務器,故障依舊。
服務器故障分析:
北亞企安數據恢復工程師在日常工作中經常碰到這類故障。出現這類故障的原因:1、管理員沒有及時檢修服務器設備狀態,服務器在即將出現故障的時候沒有及時處理。2、raid陣列一旦創建完成后,理論上raid信息不會改變,但是意外斷電也可以導致raid信息丟失。
本案例中的故障情況極有可能就是服務器多次斷電導致raid卡硬件損壞。
服務器數據恢復過程:
1、將故障服務器陣列中所有磁盤編號后取出,由硬件工程師檢測后沒有發現有硬盤存在硬件故障。以只讀方式將所有磁盤做扇區級別的全盤鏡像,在鏡像過程中觀察這些硬盤的物理狀態,確認無物理故障。鏡像完成后將所有磁盤按照編號還原到原服務器中,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
2、基于鏡像文件分析所有硬盤底層數據,結合文件系統存儲規則分析獲取到該raid陣列中的raid數據塊大小、raid盤序以及raid校驗方式。使用分析得到這些raid信息虛擬重組raid陣列。
3、重組完raid磁盤陣列后進行邏輯校驗,校驗無誤后再交由用戶方進行驗證。
4、用戶仔細驗證后,確認服務器raid陣列中的數據已經恢復到故障前的狀態,本次服務器數據恢復工作完成。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9295瀏覽量
85869 -
RAID
+關注
關注
0文章
279瀏覽量
35142 -
數據恢復
+關注
關注
10文章
585瀏覽量
17583 -
磁盤
+關注
關注
1文章
380瀏覽量
25244
發布評論請先 登錄
相關推薦
評論