【用户单位】
XXXX网站
【数据恢复故障描述】
DELL POWEREDGE 2850服务器,内置6块300G SCSI硬盘 ,组成RAID5,安装LINUX REDHAT 4操作系统,存储大量照片,文件系统采用EXT3。据后期推断,早先已有一块硬盘离线,但机房内并未发现,直至另一块硬盘掉线后系统瘫痪才知道。DELL工程师建议将其中一块硬盘强制上线,但同时指出操作具有风险。用户将某盘强制上线后,发现操作系统启动时异常,感觉不妙,于是关掉服务器,寻求专业数据恢复机构服务。
【数据恢复故障分析】
此类故障非常普遍,RAID5仅支持唯一一块硬盘掉线的冗余保护,当两块硬盘先后离线后,RAID即无法通过运算提供完整数据块,RAID便会下线。同时,控制器为了稳定起见,只要有硬盘下线,便不会自动上线,这样不通过人为干预,RAID但会进入瘫痪状态。通常情况下,因RAID控制器的敏感性,掉线的硬盘多数不会有严重的物理问题,许多甚至于硬盘完好(掉线是因为信号受阻,电源波动或控制器BUG等随机原因),所以数据恢复的可靠性较高。强制上线具有较大的风险,如果上线错误,会导致控制器自动做某些不可逆的操作,如果再进入操作系统,因文件系统不一致,会导致修复,继而导致全部硬盘数据不一致。本例即是如此。
【数据恢复过程】
1、完整备份所有硬盘,发现有多块硬盘已经存在坏道,只是RAID没有读到,暂时无下线。
2、在备份中分析原来RAID的组成结构,构建虚拟RAID环境。
3、验证RAID结构正确,修正部分后期破坏的结构后将数据导出到另一中间存储。
4、重新用完好硬盘搭建DELL 2950上的新RAID5。
5、将数据迁移至新RAID。
【数据恢复结论】
历时2天,数据库100%恢复成功。上千万图片文件中抽样检测,有极少数出现问题(概率及理论推断,不超过万分之一)
【数据恢复服务承诺】
1 .免费检测
2. 与客户签订保密协议(非定制免费),对客户的数据严格保密
3. 数据恢复不成功不收费
4. 专业工程师提供服务,同时由其他工程师审核、会诊数据恢复方案及流程
5. 数据恢复前报价,客户确认后工程师开始数据修复
6. 整个恢复过程不会对客户的原盘有任何的写操作,以确保原盘的数据完全