zoukankan      html  css  js  c++  java
  • Raid磁盘阵列更换磁盘时另一块盘离线(v7000存储数据恢复)

    【故障描述】
    客户设备型号为IBM V7000存储,架构为AIX+oracle+V7000存储阵列柜,需要恢复的数据主要存放在阵列柜上,共8块600G容量的SAS机械硬盘(其中一块为热备盘)。
    IBM V7000磁盘故障,在更换磁盘数据同步到20%左右时,另一个磁盘也出现了问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。从存储管理界面查看,两块硬盘显示故障脱机,其中5号槽位故障硬盘为热备盘,故障情况如下:


    客户的阵列柜中共创建了2组Mdisk,加到一个pool中,现客户主要数据pool无法加载,其中共5个通用卷均无法挂载,具体情况如下图所示:

    【镜像磁盘】
    为防止数据恢复过程中由于误操作对原始磁盘造成二次破坏, 使用数据恢复工具为其中的7块磁盘做镜像, 用PC3000给3号槽位的故障硬盘做镜像(可能有较多坏道), 以后所有的数据恢复操作都在镜像盘上进行, 不会对原始磁盘造成影响。

    【恢复流程】
    恢复方案一、对存储进行强制上线操作
    分析故障存储中,故障硬盘的离线顺序。
    修复后离线的故障硬盘。
    将修复的硬盘插回存储,进行强制上线操作。
    恢复方案二、解析存储结构,恢复服务器数据
    1、Mdisk分析及重组
    A、根据客户给出的部分配置信息,将硬盘按照Mdisk组分类。
    B、分析每一组Mdisk中的所有硬盘,得到相关raid信息。
    C、使用专业的数据恢复软件对Mdisk进行虚拟重组。  
    2、    pool分析
    A、对所有Mdisk进行分析,得到pool的相关信息。
    B、解析pool在Mdisk上的分布情况。
    3、LUN结构分析
    A、分析pool中的条带大小。
    B、解析LUN位图,分析各LUN在pool中的分布情况。
    C、编写程序提取LUN。
    根据raid5的特性得知,其最大允许一块成员盘离线,即在有一块成员盘故障的情况下还可以正常使用。客户存储设备已经失效,各组Mdisk中只有一块硬盘离线。
    提取V7000存储的日志,通过分析日志得到各故障硬盘的离线顺序。


    【数据恢复结果迁移】
    对生成出的数据进行随机抽样检测,数据没有问题。在新的存储设备上创建与原先环境一样大小数量的LUN,将提取出的数据LUN的镜像文件,使用dd的方式,复制到存储上创建的LUN中,数据一切正常。本次数据恢复工作圆满完成。

  • 相关阅读:
    HDU 3081 Marriage Match II
    HDU 4292 Food
    HDU 4322 Candy
    HDU 4183 Pahom on Water
    POJ 1966 Cable TV Network
    HDU 3605 Escape
    HDU 3338 Kakuro Extension
    HDU 3572 Task Schedule
    HDU 3998 Sequence
    Burning Midnight Oil
  • 原文地址:https://www.cnblogs.com/frombyte/p/8991458.html
Copyright © 2011-2022 走看看