我有一个生产 RAID 阵列,它遇到了问题。幸运的是,我在配置它时分配了一个热备用。现在的状态如下:
mdadm --detail /dev/md2
/dev/md2:
Version : 0.90
Creation Time : Sun Jul 4 14:49:33 2010
Raid Level : raid5
Array Size : 3907039744 (3726.04 GiB 4000.81 GB)
Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
Raid Devices : 5
Total Devices : 6
Preferred Minor : 2
Persistence : Superblock is persistent
Update Time : Sun Aug 5 11:56:50 2012
State : active, degraded, recovering
Active Devices : 4
Working Devices : 5
Failed Devices : 1
Spare Devices : 1
Layout : left-symmetric
Chunk Size : 64K
Rebuild Status : 63% complete
UUID : dce41d37:804dea59:e5727503:733c194b
Events : 0.13139
Number Major Minor RaidDevice State
0 8 145 0 active sync /dev/sdj1
1 8 161 1 active sync /dev/sdk1
2 8 177 2 active sync /dev/sdl1
3 8 193 3 active sync /dev/sdm1
5 8 225 4 spare rebuilding /dev/sdo1
6 8 209 - faulty spare /dev/sdn1
但是,如果这一切完成,我需要做什么才能用新的备用驱动器替换故障驱动器?理想情况下,我不想下周关闭系统。
答案1
如果您的系统支持热插拔(sata,sas,...),那么您可以执行以下操作:
mdadm /dev/md2 --remove /dev/sdn1
从 raid 阵列 md2 中移除磁盘。稍后,当您连接新磁盘并对其进行分区时,您可以执行以下操作:
mdadm /dev/md2 --add /dev/sdx1
将其添加到突袭中。
答案2
是否需要关闭服务器完全取决于操作系统和硬件host-swap
功能。 如果 hot-swap
受支持在整个堆栈中,应该可以在服务器运行时取出磁盘。
另一方面,hot spare
如果需要的话,突袭阵列只会给你时间来计划预定的停机时间。