在启动过程中,我收到一条消息,称 md RAID 阵列已降级。我的第一反应是重新启动。现在一切似乎都运行正常。所有磁盘都处于活动状态。
让我担心的是,其中一个磁盘正处于生命危险之中。我该如何诊断哪个磁盘暂时出现故障?我可以运行一些测试来查看是否需要更换吗?它仍在保修期内,所以如果我更换它,我希望能够声称它确实快要坏了。
答案1
首先,您收到的 mdadm 警告应该会显示哪些磁盘已降级。您能否将其与当前/proc/mdstat
输出一起剪切并粘贴到您的问题中?
其次,写入 md 设备的错误应该记录在 syslog 下。你能用 找到任何东西吗grep sda /var/log/messages
?你可能需要在 grep 中运行sd[a-f]
和hd[a-d]
以确保捕获所有可能的光盘。
第三,smartctl -a /dev/sda
应该为您提供有关 /dev/sda 的健康检查信息,如果您的其他 HDD 具有 SMART 感知功能(大多数现代驱动器都具有),则应该为您提供类似的健康检查信息。
如果你不能从中得到一些东西,那么它可能就不会失败!
稍后编辑:Marcog,抱歉,我的错,我错过了你警告中的“启动期间”部分。我真的应该更仔细地阅读。我同意你的观点,这听起来像是磁盘没有被正确检测到。smartctl
不过,我确实推荐这种方法;它可以用于-t
强制执行一组测试之一(请参阅手册页),其中许多测试适用于实时磁盘(包含数据并已安装)。我每隔几个月就会这样做,只是为了避免意外失败