服務器數據恢復環境:
某品牌ProLiant DL系列服務器,
6塊SAS硬盤組成RAID5磁盤陣列,
WINDOWS SERVER操作系統,
存儲了企業的內部文件。
服務器故障&分析:
服務器在發生故障前有過幾次意外斷電,每次斷電重啟后沒有出現異常。直到最后一次斷電重啟沒有成功,RAID報錯,提示無法找到存儲設備。進入RAID管理模塊,執行任何操作就死機。管理員多次重啟服務器后還是無法成功進入操作系統。
通常服務器出現這類故障,有很大的可能性是因為意外斷電導致RAID模塊損壞(RAID管理信息丟失或RAID模塊硬件損壞)。RAID陣列創建完成后,管理模塊信息就會固定下來不會再發生變化。但是raid陣列的模塊信息畢竟不是只讀的,也是可以修改的,而意外斷電就可能導致模塊信息被篡改或者丟失,多次斷電甚至可能導致RAID卡元器件損壞,服務器失去對多塊物理硬盤進行RAID管理的中間層模塊。根據本案例服務器的故障表現,北亞企安數據恢復工程師初步判斷故障原因就是RAID卡硬件損壞,如果是這種情況,通過常規方法無法獲取6塊磁盤中的數據。
服務器數據恢復過程:
1、經過物理故障檢測發現故障服務器內的所有硬盤均可以正常讀取,無物理故障。
2、編號后將故障服務器內的所有硬盤以只讀方式進行鏡像備份,鏡像完成后將所有硬盤按照編號還原到故障服務器中。后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始數據造成二次破壞。
3、基于鏡像文件,北亞企安數據恢復工程師分析故障服務器中raid5磁盤陣列結構,確定raid陣列的硬盤順序、數據塊大小、陣列校驗方式等raid相關信息。
4、利用獲取到的raid陣列信息虛擬重構raid陣列并進行邏輯校驗,確保重構RAID各項參數正確無誤后驗證重要數據。
5、經過數據恢復工程師驗證后沒有發現異常,讓管理員親自驗證無問題后將數據遷移到提前準備好的環境中,本次數據恢復工作完成。
服務器數據安全Tips:
1、盡量保證機房供電穩定,重要設備配備UPS,以減少供電異常影響服務器及存儲的正常工作。
2、應定期對老舊設備進行安全檢查,評估老舊設備的運行狀態,評估是否需要對老舊設備進行硬件升級或者系統升級。
3、提前制定突發事件應急處理方案,以降低異常斷電帶來的損失。
審核編輯黃宇
-
服務器
+關注
關注
12文章
9287瀏覽量
85847 -
數據恢復
+關注
關注
10文章
585瀏覽量
17577
發布評論請先 登錄
相關推薦
評論