子系统是否md
输出任何消息(到 syslog/systemd-journal)以指示它正在降级状态运行(或任何其他可能指示它已成功对驱动器故障做出反应的消息,如在这里暗示)?
例如,我看到很多错误,因为sd
指示诸如Unrecovered read error
但我没有看到类似“在备用位置重试成功”之类的内容。也许没有消息就是好消息?
过去,镜像软件/硬件会生成系统日志条目,指示设备何时降级或需要注意。不md
这样做吗?
背景:相关系统已经部署并正在远程监控(通过系统日志/日志信息,因此mdadm
此时没有或任何其他交互式命令/任何类型的访问可用)。
答案1
我对由两个循环设备构建的 RAID 1 阵列进行了快速测试。
dd bs=1M count=100 if=/dev/zero >/tmp/0.img
cp /tmp/0.img /tmp/1.img
i0=$(losetup --show --find /tmp/0.img); echo $i0
i1=$(losetup --show --find /tmp/1.img); echo $i1
mdadm --create /dev/md99 --metadata default --level 1 --raid-devices 2 $i0 $i1
设置一半错误
mdadm --manage /dev/md99 --set-faulty $i1 # For me, $i1=/dev/loop1
从内核给我这个(以及其他相关的 RAID1 消息)
Oct 6 17:36:10 pi kernel: [4087450.030438] md/raid1:md99: Disk failure on loop1, disabling device
Oct 6 17:36:10 pi kernel: [4087450.030438] md/raid1:md99: Operation continuing on 1 devices.