服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
EMC存儲(chǔ),多塊stat硬盤組建raid5磁盤陣列,兩塊熱備盤,上層采用zfs文件系統(tǒng)。
服務(wù)器故障&檢測(cè)&分析:
EMC存儲(chǔ)中的raid5磁盤陣列有2塊硬盤出現(xiàn)故障,但是只有一塊熱備盤被激活,raid5磁盤陣列崩潰,存儲(chǔ)不可用。
服務(wù)器數(shù)據(jù)恢復(fù)工程師前往現(xiàn)場(chǎng)對(duì)故障存儲(chǔ)設(shè)備進(jìn)行檢測(cè)。經(jīng)過簡(jiǎn)單排查后確認(rèn)raid5陣列癱瘓,上層lun無法使用,2塊熱備盤只有一塊啟動(dòng)。
硬件工程師對(duì)掉線硬盤進(jìn)行物理故障檢測(cè),均未檢測(cè)到壞道,磁頭也不存在物理故障。在進(jìn)行數(shù)據(jù)恢復(fù)之前不需要進(jìn)行物理修復(fù)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、在恢復(fù)數(shù)據(jù)之前將故障存儲(chǔ)設(shè)備上的所有數(shù)據(jù)以只讀方式鏡像備份。
2、服務(wù)器數(shù)據(jù)恢復(fù)工程師基于鏡像備份文件分析故障raid5中的每塊硬盤底層數(shù)據(jù),發(fā)現(xiàn)兩塊熱備盤內(nèi)沒有任何數(shù)據(jù),也就是說被激活的那塊熱備盤也沒有同步到任何數(shù)據(jù),故障raid5磁盤陣列中的兩塊熱備盤在磁盤離線后沒有起到任何作用。想要恢復(fù)數(shù)據(jù)需要通過分析獲取到該raid5磁盤陣列的相關(guān)信息來重組raid5。
3、服務(wù)器數(shù)據(jù)恢復(fù)工程師使用北亞企安自主研發(fā)的服務(wù)器數(shù)據(jù)恢復(fù)工具解析出該組raid5磁盤陣列的基礎(chǔ)信息,根據(jù)這些信息虛擬重組raid5磁盤陣列。
*將有多塊硬盤掉線的磁盤陣列中最早掉線的那塊硬盤從陣列中剔除,比對(duì)每塊硬盤在同一個(gè)條帶上的數(shù)據(jù)是否一致,將同一個(gè)條帶上數(shù)據(jù)明顯不同的硬盤剔除后進(jìn)行條帶校驗(yàn),直至找到數(shù)據(jù)恢復(fù)的最佳狀態(tài)為止。
4、重組raid5陣列后,服務(wù)器數(shù)據(jù)恢復(fù)工程師分析lun信息,然后使用自主開發(fā)的程序解析和導(dǎo)出lun數(shù)據(jù)的map。
5、使用北亞企安自主開發(fā)的程序解析和恢復(fù)上層的文件系統(tǒng)。該故障存儲(chǔ)設(shè)備上層采用的是zfs文件系統(tǒng),服務(wù)器數(shù)據(jù)恢復(fù)工程師解析文件系統(tǒng)時(shí)發(fā)現(xiàn)部分文件系統(tǒng)元文件報(bào)錯(cuò),數(shù)據(jù)恢復(fù)工程師對(duì)自主開發(fā)的程序進(jìn)行debug調(diào)試,讓程序適應(yīng)本案例數(shù)據(jù)恢復(fù)的需求。
6、經(jīng)過調(diào)試發(fā)現(xiàn),導(dǎo)致zfs文件系統(tǒng)解析報(bào)錯(cuò)的原因是由于存儲(chǔ)設(shè)備的突然癱瘓導(dǎo)致zfs文件系統(tǒng)中某些元文件被破壞,導(dǎo)致無法正常解析。服務(wù)器數(shù)據(jù)恢復(fù)工程師對(duì)損壞的元文件進(jìn)行手工修復(fù),保障zfs文件系統(tǒng)可以正常解析。
7、zfs文件系統(tǒng)解析完成后,服務(wù)器數(shù)據(jù)恢復(fù)工程師將故障raid5陣列內(nèi)的數(shù)據(jù)完整導(dǎo)出,由用戶方工程師搭建數(shù)據(jù)驗(yàn)證環(huán)境,對(duì)恢復(fù)出來的數(shù)據(jù)進(jìn)行驗(yàn)證。經(jīng)過反復(fù)驗(yàn)證,用戶原服務(wù)器內(nèi)的所有數(shù)據(jù)均完全恢復(fù)。
審核編輯:湯梓紅
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9293瀏覽量
85851 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
585瀏覽量
17580 -
RAID5
+關(guān)注
關(guān)注
0文章
122瀏覽量
12751
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論