Debian，mdadm，阵列降级，重新添加后磁盘变为备用

Question 1

看起来 MD 保存了错误的设备。sda 出现问题，在从其读取块以重新同步 sdb 时引发了无法恢复的读取错误。

删除 sdb 后，sda 上的数据会发生变化吗？如果没有，那么你可能很幸运 - 即使在重新同步失败后，sdb 上的文件系统可能仍处于一致状态；让 MD 使用 sdb 组装阵列。

但这有点不太可能；更有可能的是，您将有一个很好的机会来了解您的备份策略的效果如何。

Answer

看起来 MD 保存了错误的设备。sda 出现问题，在从其读取块以重新同步 sdb 时引发了无法恢复的读取错误。

删除 sdb 后，sda 上的数据会发生变化吗？如果没有，那么你可能很幸运 - 即使在重新同步失败后，sdb 上的文件系统可能仍处于一致状态；让 MD 使用 sdb 组装阵列。

但这有点不太可能；更有可能的是，您将有一个很好的机会来了解您的备份策略的效果如何。

Question 2

请注意，您的所有 MD 阵列都处于危险之中——不仅仅是“正式”降级的阵列——因为它们都基于两个物理设备：sda和sdb。我真心希望您有适当的备份和/或系统恢复程序，以防万一情况真的变得很糟糕。正如 Shane Madden 所说，重新同步的日志显示了一个令人担忧的错误，这可能表明它sda本身不太健康。

最好的办法是sdb立即将其取出并更换。如果您手边没有替换件，请尽快订购一个（也许可以利用这段时间对所有阵列进行最后一次完整备份，因为它们仍然完好无损！）。您的替换驱动器需要进行适当的分区，然后将分区相应地添加到您的四个阵列中。希望一切顺利，所有阵列都能成功重新同步。

但是，如果 Shane 是正确的，并且故障导致的进一步错误sda阻碍了正确的重新组装/重新同步，那么下一步要尝试的就是拉出sda它，用旧的（可能仍然是好的）替换它，然后看看你的旧驱动器和新的替换驱动器sdb的组合是否能成功重新组装和重新同步。sdb

最后，如果以上方法都不起作用，那么最后要尝试的（在完全重建和恢复系统之前）是更换驱动器控制器。我曾见过驱动器控制器失灵并给原本健康的阵列带来问题。测试控制器是否是导致 MD 错误的原因的一种方法是将其中一个“故障”驱动器放入另一台装有已知良好控制器和工具的 Linux 机器中mdadm。由于所有阵列都是 RAID1，因此任何单个驱动器上的阵列都应该能够组装到可用状态（尽管性能下降），然后您可以检查文件系统、进行备份等等。

Answer

请注意，您的所有 MD 阵列都处于危险之中——不仅仅是“正式”降级的阵列——因为它们都基于两个物理设备：sda和sdb。我真心希望您有适当的备份和/或系统恢复程序，以防万一情况真的变得很糟糕。正如 Shane Madden 所说，重新同步的日志显示了一个令人担忧的错误，这可能表明它sda本身不太健康。

最好的办法是sdb立即将其取出并更换。如果您手边没有替换件，请尽快订购一个（也许可以利用这段时间对所有阵列进行最后一次完整备份，因为它们仍然完好无损！）。您的替换驱动器需要进行适当的分区，然后将分区相应地添加到您的四个阵列中。希望一切顺利，所有阵列都能成功重新同步。

但是，如果 Shane 是正确的，并且故障导致的进一步错误sda阻碍了正确的重新组装/重新同步，那么下一步要尝试的就是拉出sda它，用旧的（可能仍然是好的）替换它，然后看看你的旧驱动器和新的替换驱动器sdb的组合是否能成功重新组装和重新同步。sdb

最后，如果以上方法都不起作用，那么最后要尝试的（在完全重建和恢复系统之前）是更换驱动器控制器。我曾见过驱动器控制器失灵并给原本健康的阵列带来问题。测试控制器是否是导致 MD 错误的原因的一种方法是将其中一个“故障”驱动器放入另一台装有已知良好控制器和工具的 Linux 机器中mdadm。由于所有阵列都是 RAID1，因此任何单个驱动器上的阵列都应该能够组装到可用状态（尽管性能下降），然后您可以检查文件系统、进行备份等等。

Debian，mdadm，阵列降级，重新添加后磁盘变为备用

答案1

答案2

相关内容