我维护着几台 Linux 服务器,我们正在将它们从 SUSE Linux Enterprise Server(版本 10.4)迁移到 Scientific Linux(版本 5.9)。每台机器上的六个 SAS 硬盘驱动器连接到 Adaptec AAC-RAID 控制器,配置为 3 个 RAID-1 阵列。
在仍然运行 SLES 的机器上,使用 smartctl -t short /dev/sg[3-8] 可以成功对物理驱动器运行自检。然而,在运行 Scientific Linux 的机器上,虽然我可以使用 SMART(例如使用 --all 或 -l selftest)从驱动器收集信息,但尝试运行测试(-t short、-t long 等)失败,并显示
Short offline self test failed [Operation not permitted]
知道这可能是什么原因造成的吗?
我们正在运行:
kernel-PAE-2.6.18-348.3.1.el5
smartmontools-5.42-2.el5
答案1
我的建议是使用Adaptec RAID 监控软件在此设置中。它将与您的操作系统一起工作,当作为守护程序运行时,将提供警报/日志/ SNMP 陷阱来指示驱动器故障。
虽然这不能解决 smartctl 的问题,但我认为没有必要测试你的驱动器以这种方式。这是你经常想做的事情吗?你想保护/预防什么?