mdadm 没有注意到 raid0 中的故障磁盘

Question 1

这md(4) 手册页阐明了“清洁”一词的用法（关键部分以斜体显示）：

不正常关机

当对 RAID1、RAID4、RAID5、RAID6 或 RAID10 阵列进行更改时，可能会出现短时间内不一致的情况，因为每次更新都需要将至少两个块写入不同的设备，并且这些写入可能不会同时发生。因此，如果具有这些阵列之一的系统在写入操作过程中关闭（例如由于电源故障），则阵列可能不一致。

为了处理这种情况，md 驱动程序在向数组写入任何数据之前将其标记为“脏”，并将其标记为“干净的“当阵列被禁用时，例如在关机时。如果 md 驱动程序在启动时发现阵列脏了，它会继续纠正任何可能的不一致。对于 RAID1，这涉及将第一个驱动器的内容复制到所有其他驱动器上。对于 RAID4、RAID5 和 RAID6，这涉及重新计算每个条带的奇偶校验并确保奇偶校验块具有正确的数据。对于 RAID10，它涉及将每个块的一个副本复制到所有其他块上。此过程称为“重新同步”或“重新同步”，在后台执行。阵列仍然可以使用，但性能可能会降低。

如果 RAID4、RAID5 或 RAID6 阵列在非正常关机后重新启动时性能下降（至少缺少一个驱动器，RAID6 缺少两个驱动器），则无法重新计算奇偶校验，因此数据可能被不可检测地损坏。2.4 md 驱动程序不会向操作员发出此情况的警报。2.6 md 驱动程序将无法在此情况下启动阵列，除非手动干预，但此行为可以通过内核参数覆盖。

RAID 中的一个磁盘发生故障是可能的后系统安全且正常地禁用了 RAID（例如，在关机时）。换句话说，磁盘故障发生在 RAID 处于一致、同步状态时。然后 RAID 将被标记为“干净”，并且，当下次启用它并且其中一个磁盘发生故障时，该标志将保留。

Answer

这md(4) 手册页阐明了“清洁”一词的用法（关键部分以斜体显示）：

不正常关机

当对 RAID1、RAID4、RAID5、RAID6 或 RAID10 阵列进行更改时，可能会出现短时间内不一致的情况，因为每次更新都需要将至少两个块写入不同的设备，并且这些写入可能不会同时发生。因此，如果具有这些阵列之一的系统在写入操作过程中关闭（例如由于电源故障），则阵列可能不一致。

为了处理这种情况，md 驱动程序在向数组写入任何数据之前将其标记为“脏”，并将其标记为“干净的“当阵列被禁用时，例如在关机时。如果 md 驱动程序在启动时发现阵列脏了，它会继续纠正任何可能的不一致。对于 RAID1，这涉及将第一个驱动器的内容复制到所有其他驱动器上。对于 RAID4、RAID5 和 RAID6，这涉及重新计算每个条带的奇偶校验并确保奇偶校验块具有正确的数据。对于 RAID10，它涉及将每个块的一个副本复制到所有其他块上。此过程称为“重新同步”或“重新同步”，在后台执行。阵列仍然可以使用，但性能可能会降低。

如果 RAID4、RAID5 或 RAID6 阵列在非正常关机后重新启动时性能下降（至少缺少一个驱动器，RAID6 缺少两个驱动器），则无法重新计算奇偶校验，因此数据可能被不可检测地损坏。2.4 md 驱动程序不会向操作员发出此情况的警报。2.6 md 驱动程序将无法在此情况下启动阵列，除非手动干预，但此行为可以通过内核参数覆盖。

RAID 中的一个磁盘发生故障是可能的后系统安全且正常地禁用了 RAID（例如，在关机时）。换句话说，磁盘故障发生在 RAID 处于一致、同步状态时。然后 RAID 将被标记为“干净”，并且，当下次启用它并且其中一个磁盘发生故障时，该标志将保留。

Question 2

除了显而易见的 - 只有不重视数据的人才会运行 RAID-0 - 除非您运行监视守护程序，否则 mdadm 不会向您发出任何警报： mdadm --monitor /dev/md0。

您可以使用以下方法明确检查有问题的设备：mdadm -E /dev/sdf。

当然，检测 RAID-0 阵列是否发生故障是毫无意义的：它丢失了，从备份中恢复。

Answer

除了显而易见的 - 只有不重视数据的人才会运行 RAID-0 - 除非您运行监视守护程序，否则 mdadm 不会向您发出任何警报： mdadm --monitor /dev/md0。

您可以使用以下方法明确检查有问题的设备：mdadm -E /dev/sdf。

当然，检测 RAID-0 阵列是否发生故障是毫无意义的：它丢失了，从备份中恢复。

mdadm 没有注意到 raid0 中的故障磁盘

答案1

答案2

相关内容