磁带上硬写入错误的可接受水平?

磁带上硬写入错误的可接受水平?

磁带上可接受的硬写入错误水平是多少?具体来说,HP LTO-2 介质上可接受的硬写入错误水平是多少?是硬错误数量、使用时间与错误之比,还是其他完全不同的因素?

更多背景

我们正在使用一个 MSL6000 库,其中有一个 LTO-2 驱动器,使用 Backup Exec 11d(目前)。Backup Exec 总是显示大多数驱动器的一些软错误,但有些驱动器开始显示硬错误。备份是通过立即验证完成的,验证尚未失败,所以我现在没有理由感到恐慌。

虽然我可以找到驱动器的占空比(250,000 小时),但我似乎找不到任何确切的数字来表明特定磁带应该何时退役。

如果有轮换介质的最佳实践,我也很乐意听听。我们很快也会迁移到 LTO-4 介质,因此对那里的错误的想法也会有所帮助。

编辑后添加:

我并不是每盘磁带都有硬错误。下面介绍一下我所看到的:

Tape    Hours in Use    Hard Errors
A       142             11
B       255             0
C       159             2

我的绝大多数磁带都像 B 和 C。A 是异常值。

我正在寻找某种最佳实践。磁带验证无误。我不希望在想要恢复时磁带出现故障,但如果没有必要,我也不想扔掉带有大量错误的磁带。

答案1

从我的经验来看,这些错误率仍然很低。来自 LTO ECC 规范:

LTO-Ultrium 使用的 ECC(错误纠正代码)功能强大,即使在读取操作中丢失八个磁道中的一个,并且剩余磁道上多达 1% 的字节损坏,也可以确保可靠地恢复数据

对于我工作过的商店,我们设定了磁带在库中循环的次数指导方针,之后我们才会将其从循环中清除(通常至少 20 或 30 次)。我们还每季度恢复一次磁带样本,并验证数据的 md5sum,以确保整个备份系统正常运行。

除了您看到的错误率之外,还有许多其他变量,其中一些对磁带寿命更为关键:

  • 磁带长期存储的环境(可以说是最重要的)
  • 环境中的变化次数(可能是当它们从库中轮换到存储中时)
  • 磁带的使用次数(读取和写入)
  • 磁带的年龄
  • 数据的重要性(对真正关键的数据进行多次备份可能是有意义的)

这通常称为媒体生命周期管理,实际上有许多公司制作企业软件套件来处理它。可能值得研究其中一些,看看是否有适合您商店的想法。一个例子:

http://www.spectralogic.com/index.cfm?fuseaction=products.displayContent&CatID=1852

相关内容