SAS 驱动器有几个坏块是正常的吗?还是我应该尽快更换驱动器?

SAS 驱动器有几个坏块是正常的吗?还是我应该尽快更换驱动器?

我有一个驱动器(RAID 1 镜像的一部分)有两个坏块。Adaptec Storage Manger 在检测到这些块时给我发了电子邮件。它显示该驱动器有 4 个中等错误,但状态仍为“最佳”。

这是我第一次使用 Adaptec RAID 控制器。我不知道偶尔出现坏块是否正常,或者我是否应该立即更换该驱动器。


更新:当天晚些时候,驱动器出现故障!


磁盘子系统是:

  • 带有 ZMM 的 Adaptec 6405
  • (2)Seagate 近线 SAS 硬盘(ST31000424SS)

另一个驱动器尚未报告任何坏块。我正在运行一致性检查。

Adaptec 存储管理器屏幕截图

答案1

当驱动器用于阵列时,控制器将设置时间限制错误恢复。如果磁盘无法立即读取数据,这将导致磁盘报告介质错误。这并不意味着它们不会从读取错误中恢复,也不意味着该扇区完全不可读。(
廉价的 SATA 驱动器不支持 TLER,并且会导致读取操作在驱动器尝试恢复数据时挂起;这只是廉价的 SATA 驱动器不应该在阵列中使用总线的众多原因之一;这当然不适用于这个特定问题)

如果磁盘确定扇区不可读,它将重新映射该扇区。原始坏扇区不会向上报告,因此操作系统上运行的软件无法知道。您唯一能做的就是查找 SMART 报告,看看是否/有多少扇区已被重新映射。许多扇区被重新映射是即将发生坏事的良好迹象。SMART 还可能报告磁盘发生软错误和硬错误的次数。

无论如何,SMART 故障前预测并没有什么帮助;谷歌 SMART 研究支持这一点。

答案2

大型驱动器具有大量额外空间可用于移动坏扇区,我曾看到数百个扇区在两周内被替换,然后驱动器又继续运行了一个月(RAID6,因此我们不着急)。

如果它每天都提醒你更换了几个扇区,那么我会在它出现故障之前更换它。第一次使用驱动器时突然出现坏扇区并不可怕,但持续出现这种情况通常意味着外壳中有微粒或读/写头损坏。

答案3

我没有使用过 SAS 驱动器,但我使用过普通的 SCSI 驱动器和 IDE 驱动器,它们会出现一些坏块,但之后可以正常工作多年,没有出现任何其他问题。SMART 状态应该会告诉您驱动器何时出现故障并有发生故障的风险。

此外,只要您使用 RAID(除 RAID 0 之外),那么在发生故障时您都会受到保护。

答案4

我通常不会回答我自己的问题,但在这种情况下我有一个明确的答案:尽快更换驱动器。当天晚些时候,有问题的硬盘出现故障。

凌晨时分,我收到了三封类似下面的电子邮件。我就是这么知道硬盘有坏块的,而且这是唯一的警告:

======================================================================================

ADAPTEC's EMAIL NOTIFICATION MANAGER (Instant)

======================================================================================

Event Type   : Warning
Event Source    : [email protected]
Date     : 06/29/2011
Time     : 05:29:03 AM PDT

--------------------------------------------------------------------------------------
Event(s) List With Description
--------------------------------------------------------------------------------------
Bad Block discovered: controller 1 (21a6e00).
--------------------------------------------------------------------------------------

**[Note]:   This message was generated by the Adaptec Storage Manager Agent.
Please do not reply to this message.

到那天结束时,它还是失败了。

相关内容