我有一台服务器,配有 Adaptec 6405 RAID 控制器和 4 个磁盘,配置为 RAID 5。数据中心的工作人员打电话给我,因为他们注意到其中一个驱动器托架上的红色 LED 亮了。
然后我使用“arcconf getconfig 1”检查了状态,并收到了状态消息“逻辑设备/故障/降级:2/0/1”。
逻辑设备的状态显示为“正在重建”。但是,我没有得到受影响物理设备的任何可疑状态,SMART 设置为“否”,SMART 警告为“0”,并且“arcconf getsmartstatus 1”未返回任何磁盘驱动器的问题。
“arcconf getlogs 1 events tabular”命令给出了大量输出(抱歉,由于我只有远程控制台访问权限,因此无法在此处粘贴日志文件,不过我可以发布屏幕截图)。以下是一些示例条目:
eventtype FSA_EM_EXPANDED_EVENT
grouptype FSA_EXE_SCSI_GROUP
subtype FSA_EXE_SCSI_SENSE_DATA
subtypecode 12
cdb 28 00 17 c4 74 00 00 02 00 00 00 00
data 70 00 06 00 00 00 00 00 00 00 00 00 02 00 00 00 00 00 00 00 00 00 00 00 00 0
“arcconf getlogs 1 device tabular”命令报告两个磁盘的 mediumErrors 1。
今天,我再次检查了控制器的状态。一切都恢复正常,控制器状态现在为“逻辑设备/故障/降级:2/0/0”,逻辑设备也全部恢复为“最佳”。我无法检查 LED 状态,我猜红色 LED 又熄灭了。
现在我有很多问题:
- 中等错误的可能原因是什么,为什么 SMART 日志也没有报告它?
- 我应该更换磁盘驱动器吗?它们是一个月前刚买的。
- 重建过程需要一两天时间,这正常吗?每个磁盘都是 2 TB,存储系统大部分时间处于空闲状态。
- 日志的时间戳似乎显示的是日志检索的时刻,而不是事件发生的时刻。
请提供意见,我们将非常感谢您的帮助。
答案1
中等错误的可能原因是什么,为什么 SMART 日志也没有报告它?
可能是与智能无关的错误?取决于 SAS 布线不兼容。
我应该更换磁盘驱动器吗?它们是一个月前刚买的。
哦,天哪,你问这个?它们现在处于完全保修期 - 如果不更换它们并等到保修期结束,你有什么好处呢?
重建过程需要一两天时间,这正常吗?每个磁盘都是 2 TB,存储系统大部分时间处于空闲状态。
嗯,是的。很高兴它成功了。看,RAID 5,23TB 磁盘 = 没有保护,RAID 5 开始在 1TB 以上发生故障。欢迎来到痛苦的世界 - 如果您重视数据,最好使用 Raid 6。
是的,它们是大型、缓慢的驱动器,需要很长时间才能重建。
日志的时间戳似乎显示的是日志检索的时刻,而不是事件发生的时刻。
可能的。