RAID 重建似乎已停止

Question

看起来您物理上移除了故障磁盘，而 Linux 却没有完全意识到这一点，因此当您添加新磁盘时，它被标记为备用磁盘（系统仍在等待您将旧磁盘放回去）。很可能是 /dev/md4 发生故障，Linux 检测到了故障，但由于 /dev/md5 是一个单独的阵列（它本身没有发生故障），Linux 仍然认为它是好的。

要从这种情况中恢复，您需要告诉系统开始使用备用磁盘，并忘记已删除的磁盘。

首先，将 RAID 阵列扩展到三设备，以便能够利用备用设备。

mdadm --grow /dev/md5 --raid-devices=3

此时它应该开始同步到备用设备，备用设备将如spare rebuilding中列出mdadm --detail，您应该在中看到同步操作/proc/mdstat。

当同步完成后，您会告诉 mdadm 忘记不再存在的设备。

mdadm --remove /dev/md5 detached

最后，将设备数量设置回 2。

mdadm --grow /dev/md5 --raid-devices=2

我无法确定你的系统是如何进入这种状态的。但可能是你的其他磁盘发生读取错误，导致重新同步停止并出现此失败状态。如果是这种情况，您将在dmesg同步操作终止时看到与此相关的日志条目。如果确实如此，您将需要一些更深层次的魔法（如果发生这种情况，请更新您的问题）并且可能需要准备好备份。

你可能还想阅读超级用户上这个几乎相同的问题因为它包含一些其他可能的解决方案。

最后，最佳做法是使用整个磁盘作为 RAID 阵列成员，或者最多使用磁盘的单个分区，然后您可以在必要时使用 LVM 划分 RAID 块设备。此配置可以避免此问题。

Answer 1