我如何诊断“冻结”的 Linux 软件 RAID 设备？

Question

首先升级你的内核。该内核包含一个错误这导致各种 ioctl 在某些 mdraid 和 LVM 配置中打印这些警告（并且可能失败）。

如果修复内核无法解决问题，请对所有驱动器运行扩展自检。请注意，每个驱动器的自检可能需要几个小时，并且在运行时会略微降低性能，因此应在系统活动较少时运行。例如，要安排自检在晚上 11 点开始：

at 11 pm <<JOB
for drive in /dev/sd?
do
    smartctl -t long $drive || :
done
JOB

第二天晚些时候，检查测试结果：

for drive in /dev/sd?
do
    echo Test results for drive $drive
    smartctl -l selftest $drive || :
done

如果内核更新没有解决问题，那么您可能会发现驱动器自检失败。

如果你不找到自检失败的驱动器，无论如何都要检查驱动器属性。

for drive in /dev/sd?
do
    echo Attributes for drive $drive
    smartctl -A $drive || :
done

请注意，即使没有标记为失败，其中一些属性也可能表示存在问题；因此请找专家检查它们，或将它们附加到您的问题中。

Answer 1