存储介质有很多种。以下列举几种:
- DVD
- CD
- 普通硬盘
- SSD 硬盘
- USB 闪存盘
假设我已将一些文件保存到某个媒体。如何计算媒体/设备在 X 个时间单位内损坏且我无法访问内容的概率?
是否有任何好的来源可以提供针对不同设备和媒体类型的统计数据和公式?
如果可能的话,我想要数字和公式。采用“使用子、父和祖父类型的备份方案,其中祖父被复制并存储在两个不同的安全位置”可能确实是个好建议。但我希望能够根据一些现实世界的统计数据计算出设备/媒体发生故障的概率。
答案1
让我们从硬盘开始。有三项很好的研究提供了大量硬盘的真实统计数据,值得关注: 卡内基梅隆大学,谷歌, 和Netapp。有意义的统计数据是年度故障率 (AFR),即驱动器在给定年份内发生故障的频率。这些研究显示的一个不足为奇的结果是,制造商的规格如下平均故障前时间大大低估了一年内磁盘故障的概率。这些数字因条件而异,我从中得出的经验法则是,在最佳条件下,使用良好的设备,您可能会达到 2% 的 AFR,但您应该预计最坏情况下的 AFR 接近 10%。
如果您有两个设备,其中包含相同数据的副本,并且它们的故障概率在统计上是独立的,那么您只需将百分比相乘即可得到两个设备都发生故障的概率。例如,假设两个硬盘的故障率为 5%(合理的中间值),则您在一年内同时丢失这两个硬盘的概率为 5% * 5% = 0.25%。现在,如果两个硬盘都在同一个系统中,那么两个硬盘同时损坏的概率要高得多——它们远非独立——因此实际的概率介于 5% 和 0.25% 之间;如果不深入研究控制器和电源故障等统计数据,就不可能比这个概率更接近。请参阅标准 RAID 级别此处有更多示例和背景。
回到你最初的问题,其他类型的媒体怎么样?尽管平均无故障时间事实证明,对于硬盘而言,MTBF 是一个非常乐观的值,对于许多其他媒体类型而言,这是您能找到的最佳评级。您可以使用以下公式将多个设备的 MTBF 或 MTTF 组合起来:在线可靠性计算器。您可能能够找到一些您正在考虑的其他媒体类型的实际研究,这些研究可以帮助您找到更现实的 MTBF 数字,而不是使用制造商的数字。