如果 md/linux RAID 能够正确补偿故障驱动器,我应该看到什么?

如果 md/linux RAID 能够正确补偿故障驱动器,我应该看到什么?

子系统是否md输出任何消息(到 syslog/systemd-journal)以指示它正在降级状态运行(或任何其他可能指示它已成功对驱动器故障做出反应的消息,如在这里暗示)?

例如,我看到很多错误,因为sd指示诸如Unrecovered read error但我没有看到类似“在备用位置重试成功”之类的内容。也许没有消息就是好消息?

过去,镜像软件/硬件会生成系统日志条目,指示设备何时降级或需要注意。不md这样做吗?

背景:相关系统已经部署并正在远程监控(通过系统日志/日志信息,因此mdadm此时没有或任何其他交互式命令/任何类型的访问可用)。

答案1

我对由两个循环设备构建的 RAID 1 阵列进行了快速测试。

dd bs=1M count=100 if=/dev/zero >/tmp/0.img
cp /tmp/0.img /tmp/1.img
i0=$(losetup --show --find /tmp/0.img); echo $i0
i1=$(losetup --show --find /tmp/1.img); echo $i1
mdadm --create /dev/md99 --metadata default --level 1 --raid-devices 2 $i0 $i1

设置一半错误

mdadm --manage /dev/md99 --set-faulty $i1    # For me, $i1=/dev/loop1

从内核给我这个(以及其他相关的 RAID1 消息)

Oct 6 17:36:10 pi kernel: [4087450.030438] md/raid1:md99: Disk failure on loop1, disabling device
Oct 6 17:36:10 pi kernel: [4087450.030438] md/raid1:md99: Operation continuing on 1 devices.

相关内容