不久前,我在所有服务器上设置了 smartd,每天进行一次“短时间离线”测试,每周进行一次“长时间离线”测试。配置为“-s (S/../.././00|L/../../7/04)”。
今天我注意到我的一台服务器的平均负载超过 30,并且运行非常缓慢。经过一番检查,这是 raid5 中的所有四个磁盘都经过了延长的离线测试的结果。我是否应该进行这些测试?短暂的离线测试是否足以及时发现故障磁盘并将其更换?
如果确实需要这些,我应该在整个星期内错开它们,这样它们就不会同时发生。
答案1
短测试仅测试磁盘的电子和机械性能,而长测试还会扫描磁盘的整个表面以查找错误。长/长测试应在一小时内完成,因此您可以在周末晚上进行。好的硬件 RAID 控制器可以自行监控 SMART 参数,因此在这种情况下可能不必运行智能测试。