没有响应的 mdadm

Question

查找/var/log/messages或中的错误/var/log/kernel。听起来内核无法写入和/或读取磁盘。这可以解释为什么它无法正常重启。

您使用的是什么磁盘格式 (ext2、ext3、ext4、xfs 等)？日志式的吗？
你使用的是什么内核？检查一下是否存在任何内核错误。
发生这种情况时，请检查哪些分区（md[0-9]）是可读/可写的
使用该hdparm实用程序检查磁盘 I/O 速度和设置是否正确设置

我一般建议您在发生这种情况后在文件系统上运行 fsck。

此外，Linux 还有几个reboot选项可以让您忽略某些磁盘问题并强制系统重新启动，而无需打电话给您的 DC 人员进行硬重置（按严重程度从低到高排序）：

   -f     Force halt or reboot, don’t call shutdown(8).

   -n     Don’t sync before reboot or halt. Note that the kernel and stor-
          age drivers may still sync.

这些都是比硬重置更安全的选择。

[编辑#1]：

检查输出以smartctl -a /dev/sd[a-z]查看是否有任何磁盘出现问题。

[编辑#2]：

我建议安排一些停机时间并升级固件。这往往可以修复很多错误。特别是 SAS 控制器和 BIOS。如果他们建议的话，也许还有其他的。

此外，由于这是 t610，它有 DRAC 接口吗？如果出现硬件故障，您通常可以在那里看到与硬件相关的日志。

Answer 1