昨晚我收到一封来自 mdadm 的电子邮件,说我的阵列上有两个驱动器可能出现故障。RAID 阵列设置为 4 个 2TB 驱动器 RAID5,带有一个热备用驱动器。这个系统真的坏了吗?热备用驱动器是否检测到了任何问题,还是两个驱动器同时出现故障?一个驱动器出现故障,开始在备用驱动器上重建,然后导致另一个驱动器出现故障?我对 RAID 的使用还很陌生,这个系统是我从以前的员工那里继承的,所以我不确定这里正确的故障排除步骤是什么。任何帮助都将不胜感激。
cat /proc/mdstat 的输出:
sudo cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10]
md0 : active raid5 sdc[4](F) sdd[5](F) sda[6](S) sdb[0] sde[3]
5860543488 blocks level 5, 64k chunk, algorithm 2 [4/2] [U__U]
mdadm --detail 的输出:
#sudo mdadm --detail /dev/md0
/dev/md0:
Version : 0.90
Creation Time : Mon Jun 21 13:54:13 2010
Raid Level : raid5
Array Size : 5860543488 (5589.05 GiB 6001.20 GB)
Used Dev Size : 1953514496 (1863.02 GiB 2000.40 GB)
Raid Devices : 4
Total Devices : 5
Preferred Minor : 0
Persistence : Superblock is persistent
Update Time : Mon Apr 29 10:52:27 2013
State : clean, FAILED
Active Devices : 2
Working Devices : 3
Failed Devices : 2
Spare Devices : 1
Layout : left-symmetric
Chunk Size : 64K
UUID : 2874db80:a0f02d66:999df3c7:ff8f8e6e (local to host bigkahuna)
Events : 0.10984
Number Major Minor RaidDevice State
0 8 16 0 active sync /dev/sdb
1 0 0 1 removed
2 0 0 2 removed
3 8 64 3 active sync /dev/sde
4 8 32 - faulty spare /dev/sdc
5 8 48 - faulty spare /dev/sdd
6 8 0 - spare /dev/sda
答案1
如果日志或 dmesg 中没有关于驱动器的 smartctl 错误。您可以尝试重新组装 RAID:
mdadm --assemble /dev/md0 --scan --force