zoukankan      html  css  js  c++  java
  • Raid磁盘阵列更换磁盘时另一块盘离线(v7000存储数据恢复)

    【故障描述】
    客户设备型号为IBM V7000存储,架构为AIX+oracle+V7000存储阵列柜,需要恢复的数据主要存放在阵列柜上,共8块600G容量的SAS机械硬盘(其中一块为热备盘)。
    IBM V7000磁盘故障,在更换磁盘数据同步到20%左右时,另一个磁盘也出现了问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。从存储管理界面查看,两块硬盘显示故障脱机,其中5号槽位故障硬盘为热备盘,故障情况如下:


    客户的阵列柜中共创建了2组Mdisk,加到一个pool中,现客户主要数据pool无法加载,其中共5个通用卷均无法挂载,具体情况如下图所示:

    【镜像磁盘】
    为防止数据恢复过程中由于误操作对原始磁盘造成二次破坏, 使用数据恢复工具为其中的7块磁盘做镜像, 用PC3000给3号槽位的故障硬盘做镜像(可能有较多坏道), 以后所有的数据恢复操作都在镜像盘上进行, 不会对原始磁盘造成影响。

    【恢复流程】
    恢复方案一、对存储进行强制上线操作
    分析故障存储中,故障硬盘的离线顺序。
    修复后离线的故障硬盘。
    将修复的硬盘插回存储,进行强制上线操作。
    恢复方案二、解析存储结构,恢复服务器数据
    1、Mdisk分析及重组
    A、根据客户给出的部分配置信息,将硬盘按照Mdisk组分类。
    B、分析每一组Mdisk中的所有硬盘,得到相关raid信息。
    C、使用专业的数据恢复软件对Mdisk进行虚拟重组。  
    2、    pool分析
    A、对所有Mdisk进行分析,得到pool的相关信息。
    B、解析pool在Mdisk上的分布情况。
    3、LUN结构分析
    A、分析pool中的条带大小。
    B、解析LUN位图,分析各LUN在pool中的分布情况。
    C、编写程序提取LUN。
    根据raid5的特性得知,其最大允许一块成员盘离线,即在有一块成员盘故障的情况下还可以正常使用。客户存储设备已经失效,各组Mdisk中只有一块硬盘离线。
    提取V7000存储的日志,通过分析日志得到各故障硬盘的离线顺序。


    【数据恢复结果迁移】
    对生成出的数据进行随机抽样检测,数据没有问题。在新的存储设备上创建与原先环境一样大小数量的LUN,将提取出的数据LUN的镜像文件,使用dd的方式,复制到存储上创建的LUN中,数据一切正常。本次数据恢复工作圆满完成。

  • 相关阅读:
    我是如何基于angular+requirejs+node做SPA项目架构的
    阿里云无线&前端团队是如何基于webpack实现前端工程化的
    angularjs源码分析之:angularjs执行流程
    你所必须掌握的三种异步编程方法callbacks,listeners,promise
    自从用了Less 编写css,你比以前更快了~
    对象的深浅拷贝
    throttle/debounce: 为你的cpu减减压(前端性能优化)
    jekyll : 使用github托管你的博客
    html5 drag api详解
    用setTimeout 代替 setInterval实时拉取数据
  • 原文地址:https://www.cnblogs.com/frombyte/p/8991458.html
Copyright © 2011-2022 走看看