我在软件 RAID 中拥有 4 个 500GB 驱动器。/dev/md0 是 RAID 1 并安装到 /boot /dev/md1 是 RAID 10 并且是交换 /dev/md2 是 RAID 10 并且是主系统和数据设备
我今晚查看了 mdadm 并注意到 md2......
State : clean, degraded
Number Major Minor RaidDevice State
0 8 3 0 active sync /dev/sda3
1 0 0 1 removed
2 8 35 2 active sync /dev/sdc3
3 8 51 3 active sync /dev/sdd3
检查 md0 和 md1,所有驱动器均显示为活动同步,且设备状态为干净。
以下是每个设备的 mdadm 完整输出以及 /proc/mdstat 的输出 http://pastebin.com/VL0uYdU9
因此看起来 /dev/sdb1 和 /dev/sdb2 分别在 /dev/md0 和 /dev/md1 中运行。但 /dev/sdb3 已从 /dev/md2 中退出(显然已被删除)
我相信,使用 RAID 10 数据是没问题的,除非我丢失了镜像另一侧的另一个驱动器。我当然会备份到外部设备,并已验证这些设备是稳定的。
我做了一些日志查询并注意到了这对日志行......
Dec 9 04:25:37 hostname smartd[3199]: Device: /dev/sdb, 1 Currently unreadable (pending) sectors
Dec 9 04:25:37 hostname smartd[3199]: Device: /dev/sdb, 1 Offline uncorrectable sectors
每 30 分钟重复一次。这种情况似乎已经持续了一段时间,并且看起来驱动器未通过 SMART 数据检查。
1 月 7 日,一个愚蠢的用户重启了服务器,以为这样可以解决邮件转发问题。
以下是 /var/log/messages 中的启动信息...http://pastebin.com/jGVsDD54
为什么 /dev/sdb1 和 /dev/sdb2 似乎运行正常,而 /dev/sdb3 却出现故障?
只是 sdb3 上的某个特定扇区出现故障?
是否值得尝试将此分区重新添加到 md2 阵列?
或者我应该将驱动器放入垃圾箱并用新驱动器替换?
答案1
SMART 故障表示整个驱动器即将发生故障(但无法预测时间范围);请尽快更换此驱动器。