mdadm resync 导致系统无响应

mdadm resync 导致系统无响应

我们有一台服务器,其中的 raid 1 磁盘正在尝试重建或同步。磁盘正在重新同步,但服务器已无响应。无法通过 ssh 进入该框,也没有任何服务响应。如果您在本地局域网上,您可以 ssh 进入,但速度非常慢,因此毫无用处。

是什么原因导致了这个问题?大约一个月前,机器坏了,我们最近用新磁盘重建了机器。无论如何,我们都需要增加磁盘大小,所以借此机会做了这件事。现在我不确定是否存在某种硬件故障。它们是使用软件 raid 的 SATA 磁盘。

通常如果一个磁盘或控制器坏了,第二个磁盘会继续运行。不知道现在发生了什么。

任何帮助均感激不尽。

答案1

您的重新同步速度对于您的磁盘 IO 能力来说太高了。运行echo 1000 >/proc/sys/dev/raid/speed_limit_max后您应该会看到快速恢复响应。一旦得到控制,请将速度限制调整到适合您硬件的水平。

答案2

可能是您的分区未正确对齐。我的系统有两个 WD1000EARS 磁盘,其分区未对齐。它有同样的问题。我重新分区了磁盘,使用 parted 创建分区并检查对齐。重建速度跃升至 60-70MB/s,系统响应非常快。与以前的情况相比,负载明显较低,等待 i/o CPU 负载非常低。

相关内容