将数据备份到硬盘并保存数年是否安全?
假设文件系统格式仍可读取,这样做安全吗?还是最好不断重写数据(每 6 个月左右)以确保其仍然有效?
或者说这是一个愚蠢的问题?
答案1
我不会长期信任任何单个设备上的重要备份。
我有很多 CD,用了一段时间后就无法读取了。(诚然,这些 CD 很便宜,但我对它们宣称的使用寿命表示怀疑。)
我曾经遇到过硬盘悄悄损坏数据的情况。
我似乎记得我甚至遇到过 SSD 故障,尽管写入次数较少,但我希望它们非常可靠。
除了所有这些因素之外,使用单一副本意味着您无法防范物理灾难:火灾等。如果您有多个副本,则可以将它们物理分开。理想情况下,我会获取一些副本(例如 3 个)并定期对所有副本运行校验和(我通常使用 MD5)。如果其中一个副本以某种方式损坏,如果您有多个其他副本,您应该能够信任大多数副本,并创建一个新的备份来替换损坏的副本。(当然,如果您将正确的校验和保存在单独的地方,您可以信任甚至一个仍然提供正确校验和的备份,作为替换的规范来源。)
当然,你要付出多少努力取决于数据的价值。我的个人家庭数据只备份在 RAIDed NAS 上。我的工作数据在 Google 数据中心,我非常信任它 :)
答案2
考虑到您的其他备份选项,HDD 是最安全的方式。其他选项包括磁带、SSD 和光学介质。
让我们分析一下每种方法的缺陷:
MT:与 HDD 相比,暴露在磁场中时更容易被擦除。读取器也越来越难找到。你不会希望 5 年后回来发现无法从介质中删除数据。
SSD:可靠,因为没有移动部件。经过几次读写循环后,它们容易发生电气性能下降,这很麻烦,而且有潜在危险。不过,在不使用驱动器时丢失数据的可能性很小。
光学介质:可靠性最低的一种介质。它们极易发生物理损坏(弯曲/翘曲),并且只需很小的力气就能使其偏离其挠度规格。此外,用于将数据写入大多数光学介质的编码方案相当复杂,因此单个元件故障导致无法读取的可能性更大。
HDD:固态、密封设备。比上述大多数设备更容易因物理冲击而损坏。具有精密的机械部件,如果损坏,可能导致读取/写入失败。
然而,HDD 的优点在于它们是密封的。所有移动部件都存放在空气过滤外壳中。磁盘上数据位的磁稳定性相当高,不太可能发生变化。
此外,如果机械部件出现故障,可以取出盘片并直接从中恢复数据。
没有完美的选择,但是在不完美的选择中,HDD 可能是您的最佳选择。
答案3
我想说你应该每隔一年左右回收一次媒体 - 也就是说,用任何可以替换的东西来替换驱动器、光盘或磁带,并保留一份以上的副本。
很少有东西可以永恒存在,光学介质会根据质量、写入方法和存储环境而迅速退化。机械部件总是会出现故障,或者固件中可能会出现与时间或磨损相关的错误。
我经常思考你的问题,如果能保证某样东西可以使用 5 年,那会很方便。有些磁带和其他形式的备份媒体的额定使用期限为 10 年或更长时间,但我从不相信这一点,至少在没有大量冗余(不同批次的多个副本)的情况下不会相信。
保持数据新鲜并不断回收似乎是可靠的方法——这样您也可以定期对其进行测试。
答案4
HDD 的预期寿命实际上相当高,至少从磁性方面来看(将外部磁场放在一边)。它们的主要问题是,它们可以最终会遭受机械损坏,即如果不经常使用,则无法旋转,因为某些油和联轴器可能会成为问题。
我认为,真正长期存储最安全的方法是:
- 流到一个或多个磁带
- 打印到纸张和/或微缩胶片上
- 将副本保存在分布在多台物理机器和位置上的运行(正在运行)的 HDD 上
- 使用额外的外部备份空间,例如 Amazon S3
光学介质,尤其是消费者使用的光学介质,寿命出乎意料地短。您至少应该每两年检查一次读取的原始数据的质量。不过在此期间,您可能会丢失数据。
编辑:在这种情况下,一个重要的方面是您还应该向存储的文件添加校验和(MD5,SHA1等),这样您就能意识到是否发生了一些损坏。