硬盘使用年限(开机时间)到了一定程度是否需要更换?

硬盘使用年限(开机时间)到了一定程度是否需要更换?

我有几个存储阵列,其中相当一部分驱动器已通电 25,000 - 30,000 小时(2.8 - 3.4 年)。这些驱动器没有其他问题或错误。

我想知道的是:是否存在驱动器使用年限本身就足以成为更换驱动器的重要因素,即使驱动器运行正常且没有错误?

(我很好奇,人们是否倾向于一直运行驱动器直到它们出现故障或开始抛出错误,或者是否有人采取主动的方式,以通电时间作为指标来更换驱动器。)

驱动器制造商一般将企业驱动器的 MTBF 称为 1,000,000 到 1,500,000 小时,但这些数字在现实世界中并没有多大意义。

我确实找到了这项于 2007 年完成的研究:

现实世界中的磁盘故障:1,000,000 小时的 MTTF 对您意味着什么?

http://www.cs.cmu.edu/~bianca/fast07.pdf

研究表明,1 年至 5-7 年之间是“最佳时间点”,在此期间,故障率较低。在此时间之前/之后的驾驶年限往往要高得多。

答案1

不。

当驱动器发生故障(或出现可预测的故障,如 SMART)时,您会更换驱动器,而不仅仅是因为它们已经使用过一段时间。我见过使用时间超过 15 年的驱动器,也见过驱动器在不到一小时内就发生故障的驱动器,因此使用时间并不是判断驱动器故障的良好指标。

答案2

我见过使用 10-15 年的服务器,其原装驱动器仍在运行,其功能也未发生改变。我也见过使用不到一年的服务器发生灾难性的驱动器故障。

我对一直运行驱动器直到它出现故障迹象是好是坏并没有看法,所以我的回答是“这取决于”——取决于备份、数据/工具的价值、驱动器的大小、活动强度、它是否在镜像阵列中,以及是否可以承受更换它的停机时间——这可能比单纯的硬件更昂贵。

我认为基于这些因素以及特定于您的站点和应用程序的其他变量 - 这需要由您的团队做出决定,而不是某些死记硬背的年龄值。

编辑:如果数据或正常运行时间很重要,请考虑使用备份和灾难恢复策略进行演练,使用冗余服务器和具有不同批次驱动器的镜像阵列。这样,您极不可能同时发生所有故障,因此您将能够在更换损坏的硬件的同时将故障转移到正常工作的硬件,而不会丢失数据。

答案3

我从未见过(或听说过)任何人只是因为驱动器“太旧”而更换驱动器(同时保持存储/服务器处于生产状态)。

相关内容