15K RPM 驱动器发生故障

15K RPM 驱动器发生故障

三年来,我们一直使用 LSI SAN,其中装有 48 个 300GB Segate Cheetah 15K.5(型号 ST3300655FC)3.5 英寸驱动器。总共有 7 个驱动器发生故障。最近有多个驱动器发生故障。自 2010 年 5 月以来,有 6 个驱动器发生故障。

过去 6 个月的比率为 0.02(驱动器故障)/(月)/(阵列中的驱动器)。

同一间屋子里还运行着一台 HP 的旧 SAN,驱动器大概是 15K 36 GB。这些驱动器从未出现故障。

300GB 15K RPM 硬盘 3 年后以这种速度开始出现故障,这很常见吗?

答案1

对我来说,这听起来并不算太高,但考虑到您的情况,这里有几件事需要检查:

  • 驱动器的物理安装,这很可能会引起 Rob Olmos 提到的共振。检查驱动器、托架、背板等的所有螺钉是否仍然拧紧。
  • 电源可能偏离规格并可能对驱动器和其他电子元件造成额外的电气负荷。
  • 外部振动影响驱动器和/或整个装置(这是我的服务器机房最大的问题)。

答案2

不,这不是一个常见问题,但我时常看到。您运行的 Cheetah 15k 很可能都是同一“批次”制造的,因此都存在相同的故障。这就是为什么您看到许多 Cheetah 15k 在如此短的时间内出现故障的原因。

我建议联系您的 SAN 供应商并坚持要求他们纠正此问题。

答案3

嗯,您会看到 MTBF 倒置钟形曲线故障问题,所以三年后,如果您开始看到一两个磁盘出现故障,那么我预计不久之后还会有更多磁盘出现故障,正如您所看到的。然后它通常会稳定下来,进入一系列可靠性的小高峰和低谷 - 最好确保您手边有一些备用磁盘。至于为什么 HP 没有出现故障,嗯,物理原理是一样的,我想它们的行为只是受到使用模式的影响,但当它们开始出现故障时,很可能以相同的方式出现。

相关内容