该 raid1 软件阵列是否发生故障？（mdadm）

Question 1

您可以通过 mdadm 使 /dev/sdb 设备故障（最好确保使整个设备故障，即所有在其上运行的 mds 都故障），然后检查是否有错误，但从您描述的情况来看，您最好只是更换该设备。

我经常遇到 ide 设备出现故障的情况，我不断重新添加被拒绝的设备，直到最后计算机开始像您描述的那样挂起。更换故障设备解决了问题。

无论哪种情况，您都应该尽快进行备份。

Answer

您可以通过 mdadm 使 /dev/sdb 设备故障（最好确保使整个设备故障，即所有在其上运行的 mds 都故障），然后检查是否有错误，但从您描述的情况来看，您最好只是更换该设备。

我经常遇到 ide 设备出现故障的情况，我不断重新添加被拒绝的设备，直到最后计算机开始像您描述的那样挂起。更换故障设备解决了问题。

无论哪种情况，您都应该尽快进行备份。

Question 2

读取错误很常见，但磁盘可以自行纠正大部分错误。有些磁盘会撒谎并在 SMART 信息中报告读取良好，有些会报告正确的错误数量和恢复的 ECC 数量。有些磁盘（尤其是垂直磁盘）可能会出现数百万个读取错误，并且恢复的 ECC 比例可达 99.99999%（或更多）。

但是这次/dev/sdb2无法正确读取8个扇区。

然后，softraid 只需从其他磁盘获取丢失的扇区并重写它们即可恢复。然后它确定一切又正常了。

这可能是硬盘损坏的迹象，但也可能是偶然的错误、灰尘颗粒或其他原因。在报废此硬盘之前，请等待并观察是否会出现更多错误。

Answer

读取错误很常见，但磁盘可以自行纠正大部分错误。有些磁盘会撒谎并在 SMART 信息中报告读取良好，有些会报告正确的错误数量和恢复的 ECC 数量。有些磁盘（尤其是垂直磁盘）可能会出现数百万个读取错误，并且恢复的 ECC 比例可达 99.99999%（或更多）。

但是这次/dev/sdb2无法正确读取8个扇区。

然后，softraid 只需从其他磁盘获取丢失的扇区并重写它们即可恢复。然后它确定一切又正常了。

这可能是硬盘损坏的迹象，但也可能是偶然的错误、灰尘颗粒或其他原因。在报废此硬盘之前，请等待并观察是否会出现更多错误。

相关内容