我有一个驱动器(RAID 1 镜像的一部分)有两个坏块。Adaptec Storage Manger 在检测到这些块时给我发了电子邮件。它显示该驱动器有 4 个中等错误,但状态仍为“最佳”。
这是我第一次使用 Adaptec RAID 控制器。我不知道偶尔出现坏块是否正常,或者我是否应该立即更换该驱动器。
更新:当天晚些时候,驱动器出现故障!
磁盘子系统是:
- 带有 ZMM 的 Adaptec 6405
- (2)Seagate 近线 SAS 硬盘(ST31000424SS)
另一个驱动器尚未报告任何坏块。我正在运行一致性检查。
答案1
当驱动器用于阵列时,控制器将设置时间限制错误恢复。如果磁盘无法立即读取数据,这将导致磁盘报告介质错误。这并不意味着它们不会从读取错误中恢复,也不意味着该扇区完全不可读。(
廉价的 SATA 驱动器不支持 TLER,并且会导致读取操作在驱动器尝试恢复数据时挂起;这只是廉价的 SATA 驱动器不应该在阵列中使用总线的众多原因之一;这当然不适用于这个特定问题)
如果磁盘确定扇区不可读,它将重新映射该扇区。原始坏扇区不会向上报告,因此操作系统上运行的软件无法知道。您唯一能做的就是查找 SMART 报告,看看是否/有多少扇区已被重新映射。许多扇区被重新映射是即将发生坏事的良好迹象。SMART 还可能报告磁盘发生软错误和硬错误的次数。
无论如何,SMART 故障前预测并没有什么帮助;谷歌 SMART 研究支持这一点。
答案2
大型驱动器具有大量额外空间可用于移动坏扇区,我曾看到数百个扇区在两周内被替换,然后驱动器又继续运行了一个月(RAID6,因此我们不着急)。
如果它每天都提醒你更换了几个扇区,那么我会在它出现故障之前更换它。第一次使用驱动器时突然出现坏扇区并不可怕,但持续出现这种情况通常意味着外壳中有微粒或读/写头损坏。
答案3
我没有使用过 SAS 驱动器,但我使用过普通的 SCSI 驱动器和 IDE 驱动器,它们会出现一些坏块,但之后可以正常工作多年,没有出现任何其他问题。SMART 状态应该会告诉您驱动器何时出现故障并有发生故障的风险。
此外,只要您使用 RAID(除 RAID 0 之外),那么在发生故障时您都会受到保护。
答案4
我通常不会回答我自己的问题,但在这种情况下我有一个明确的答案:尽快更换驱动器。当天晚些时候,有问题的硬盘出现故障。
凌晨时分,我收到了三封类似下面的电子邮件。我就是这么知道硬盘有坏块的,而且这是唯一的警告:
======================================================================================
ADAPTEC's EMAIL NOTIFICATION MANAGER (Instant)
======================================================================================
Event Type : Warning
Event Source : [email protected]
Date : 06/29/2011
Time : 05:29:03 AM PDT
--------------------------------------------------------------------------------------
Event(s) List With Description
--------------------------------------------------------------------------------------
Bad Block discovered: controller 1 (21a6e00).
--------------------------------------------------------------------------------------
**[Note]: This message was generated by the Adaptec Storage Manager Agent.
Please do not reply to this message.
到那天结束时,它还是失败了。