我最近部署了一台配备 5 个 1TB 硬盘的服务器(我不会提及它们的品牌,但它是两大品牌之一)。最初有人警告我不要购买大容量硬盘,因为一位朋友告诉我,它们的 MTBF 非常低,我最好购买更多、容量较小的硬盘,因为它们在技术处理能力方面没有“达到极限”。
从那时起,五个磁盘中有三个出现故障。幸运的是,我能够在下一个磁盘出现故障之前更换并重建阵列,但这让我非常非常担心。
您怎么看?我是不是买到了一批质量不好的磁盘?还是说较新/容量较大的磁盘比久经考验的磁盘更容易发生故障?
答案1
你可能买到了一批坏的磁盘。出于这个原因,我对部署由同一批磁盘构建的阵列感到紧张——它们的使用寿命可能差不多,因此当其中一个磁盘发生故障时,更换磁盘可能会非常令人兴奋。
驱动器存在一些设计缺陷并非不可能,这种事情以前肯定发生过;但是,如果驱动器确实存在问题,那么互联网上通常会充斥着对该驱动器的抱怨,而不是像你通常听到的那样,听到关于任何事物的背景噪音。
答案2
除非你拥有大型组织的资源,否则这个问题很难回答。请参阅谷歌对硬盘故障的研究。
在大量购买磁盘时,我会确定每字节成本最低的粗略磁盘大小,这通常比最新的磁盘要老一代。这很合理,因为他们会提高该代磁盘的可靠性。
答案3
更多的盘片+更多的磁头意味着更高的故障概率。
取两块常见的WD硬盘
640GB = 两个盘片
1TB = 三个盘片
WD Black 640GB vs 1TB comparison
Drive Ready Time 11 sec 13
R/W Power watts 8.3 8.4
Idle Power watts 7.7 7.8
Standby watts 1 1
Max shock 300g 250g
Performance seek 29 33
Quiet seek 26 29
额外的盘片 = 噪音更大、耗电量更大、热量更多、驱动器就绪时间更慢、更容易受到冲击损坏以及振动更大。
如果他们采用相同的驱动器设计,但只使用一个盘片,那么规格会更好。在这种情况下,这些是消费级驱动器,但它们是高端消费级驱动器,缓存增加一倍,保修期为 5 年。如果您仔细检查任何品牌或款式的传统硬盘(旋转盘片)的文档,您会看到类似的计算结果。盘片越多,驱动器的可靠性越低,这纯粹是物理问题。
Jeff Hengesbach 也说过
对于“大”驱动器,主要问题是发生故障时的重建时间。驱动器越大,重建时间越长,发生更多驱动器故障和阵列潜在损失的可能性就越大。对于“大”驱动器,可用性的商业价值应确定可接受的风险水平(阵列损失),这将决定您的 RAID 级别选择和驱动器数量(驱动器越多 = 驱动器发生故障的可能性越大)。
添加少量 Graeme Perrow
具有五千万个扇区的驱动器出现坏扇区的概率是具有五百万个扇区的驱动器的十倍。我假设大型驱动器和小型驱动器的故障率相同,这可能不是一个好的假设
更多盘片 = 坏处
更多存储空间好坏参半。优点和缺点很多。
更多扇区确实意味着出现错误的可能性更大。不一定是线性的,但肯定是一个因素。
除非你更需要空间而不是可靠性,否则我建议你坚持使用单盘或双盘驱动器。需要研究,有时还需要运气才能知道订购驱动器时会得到什么,因为有些制造商不仅避免公布盘片数量,而且实际上可能以相同的部件号销售多个驱动器。
以 WD3200AAKS 为例,它有单盘 320GB 版本和双盘 320GB 版本(160GB x 2)。此外,它还使用了多个标签和驱动器外壳,因此您无法轻松查看驱动器并知道里面是哪个盘片。唯一知道的方法是在线搜索,WD3200AAKS-00B3A0 和 WD3200AAKS-75VYA0 会告诉您哪个是单盘片,但没有零售商会告诉您会得到哪个。
答案4
我不确定说“大”磁盘的 MTBF 更高是否公平。我有一个大品牌系统,里面有几块 750GB 的硬盘,在过去的 2 年多时间里,没有一块硬盘发生故障(2 年前 750 是“大”硬盘)。但我还知道一个大品牌系统,它是在 250GB 是大硬盘的时候构建的,这个阵列已经倒塌了好几次。MTBF 之争就像一场圣战。
对于“大”驱动器,主要问题是发生故障时的重建时间。驱动器越大,重建时间越长,发生更多驱动器故障和阵列潜在损失的可能性就越大。对于“大”驱动器,可用性的商业价值应确定可接受的风险水平(阵列损失),这将决定您的 RAID 级别选择和驱动器数量(驱动器越多 = 驱动器发生故障的可能性越大)。
过去几年,商用 SATA/RAID 取得了长足进步。我认为,如果大公司知道这会成为重大支持问题或导致客户失望的原因,他们就不会提供它。既然您已经更换了一些原始批次,我很想知道您今后的可靠性。