我有一个脚本,每次 Windows 7 启动时都会运行,它将 MS SQL 数据库备份到装有 12 个 Seagate ST4000NM002A-2HZ101 硬盘的 Synology NAS。每天凌晨 3 点,备份的数据库都会“恢复”到在 Synology NAS 上运行的 docker 容器中运行的 MS SQL 数据库。在过去的 6 个月里,我的 12 个硬盘中有 8 个出现故障。所有故障都发生在清晨,就在数据库恢复脚本执行之后(将最后一个数据库备份恢复到在 docker 容器中运行的 MySQL 数据库)。所有出现故障的驱动器都来自原始批次(更换的驱动器没有故障)。我是否收到了一批有问题的驱动器,或者将损坏的数据库备份恢复到 docker 容器是否会导致问题?
答案1
啊...
在过去的 6 个月中,我的 12 个硬盘中有 8 个出现了故障。
好吧,让我们来看看...
12块Seagate ST4000NM002A-2HZ101硬盘。
归类为“适用于海量数据应用的企业级硬盘”
我倾向于说将它们滥用为性能数据库可能并不明智,另一方面......“200 万小时的 MTBF 评级和每年 550TB 的支持工作量” - 这需要进行 SMART 检查,但这些看起来不像会在 6 个月内发生这种程度故障的驱动器。
如果你在同一时间从同一家商店购买了它们,我敢说你很可能买到了质量很差的一批产品。它们有长期保修,所以更换应该没有问题。
是的,备份失败听起来很正常 - 这些都是压力更大的情况 - 但 6 个月内 12 个备份中有 8 个失败的统计数据绝对是完全不真实的。
答案2
备份直接导致驱动器故障这一特别的因果关系需要比您提供的证据更多的证据。备份恢复可能是阵列上最繁重的工作负载,但这并不能解释故障是因老化磨损、制造缺陷还是其他原因造成的。
硬盘的使用寿命为几年,并且将未纠正的错误保持在每 10^14 位 1 个以下。Backblaze 数据显示大规模年故障率约为 1%。您的十几个驱动器中肯定会有一个发生故障,但一年内超过 100% 则意味着存在故障。
硬件更换最终应该能解决硬件故障。如果批次有故障或驱动器老化,驱动器更换可以解决问题。更换 NAS 阵列可能有助于解决有故障的背板。如果电源质量不佳,则更换 UPS 和电源。等等。