生产磁盘故障 - 幸运的是今天是星期天并且不在工作时间(mdadm raid 5)

生产磁盘故障 - 幸运的是今天是星期天并且不在工作时间(mdadm raid 5)

我有一个生产 RAID 阵列,它遇到了问题。幸运的是,我在配置它时分配了一个热备用。现在的状态如下:

mdadm --detail /dev/md2
/dev/md2:
        Version : 0.90
  Creation Time : Sun Jul  4 14:49:33 2010
     Raid Level : raid5
     Array Size : 3907039744 (3726.04 GiB 4000.81 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 5
  Total Devices : 6
Preferred Minor : 2
    Persistence : Superblock is persistent

    Update Time : Sun Aug  5 11:56:50 2012
          State : active, degraded, recovering
 Active Devices : 4
Working Devices : 5
 Failed Devices : 1
  Spare Devices : 1

         Layout : left-symmetric
     Chunk Size : 64K

 Rebuild Status : 63% complete

           UUID : dce41d37:804dea59:e5727503:733c194b
         Events : 0.13139

    Number   Major   Minor   RaidDevice State
       0       8      145        0      active sync   /dev/sdj1
       1       8      161        1      active sync   /dev/sdk1
       2       8      177        2      active sync   /dev/sdl1
       3       8      193        3      active sync   /dev/sdm1
       5       8      225        4      spare rebuilding   /dev/sdo1

       6       8      209        -      faulty spare   /dev/sdn1

但是,如果这一切完成,我需要做什么才能用新的备用驱动器替换故障驱动器?理想情况下,我不想下周关闭系统。

答案1

如果您的系统支持热插拔(sata,sas,...),那么您可以执行以下操作:

mdadm /dev/md2 --remove /dev/sdn1

从 raid 阵列 md2 中移除磁盘。稍后,当您连接新磁盘并对其进行分区时,您可以执行以下操作:

mdadm /dev/md2 --add /dev/sdx1 

将其添加到突袭中。

答案2

是否需要关闭服务器完全取决于操作系统和硬件host-swap功能。 如果 hot-swap受支持在整个堆栈中,应该可以在服务器运行时取出磁盘。

另一方面,hot spare如果需要的话,突袭阵列只会给你时间来计划预定的停机时间。

相关内容