光纤通道:总线重置时 LTO 磁带被覆盖

光纤通道:总线重置时 LTO 磁带被覆盖

我们的客户遇到了一种情况,我希望更好地了解一下。

事情是这样的:

  • 带有 LTO 磁带驱动器的库连接到光纤通道环境
  • 在 Windows Server 2008 上运行的归档软件正在将数据写入磁带
  • 在某个时候,磁带倒带了,但软件却没有意识到这一点,写入操作抹去了磁带上的内容
  • 通过将磁带上的预期位置与实际位置进行比较来检测情况

我不知道设备供应商的详细信息。

看来磁带驱动器发生了重置,导致磁带倒带,但这种情况并没有作为错误报告给驱动程序和软件,因此软件假定写入成功。

我阅读了大量文档来了解为什么会发生这种情况,但我无法做出任何最终结论来帮助客户。

  • FC HBA 或交换机能否自行重新传输总线重置时的 SCSI 写入?
    • 这样的东西可以配置吗?
  • FC HBA 或交换机是否忽略了报告的单元注意?
  • 操作系统驱动程序是罪魁祸首吗?
  • 这个是特定供应商的吗?

如果有人能给我提供一些继续的指导,我将非常感激。

答案1

这是磁带驱动器的一个已知问题,只需从侧面看该设备即可轻松倒带(即以错误的方式打开它 - 通过倒带设备 - 例如只是为了检查状态)。

至少有一种主要的 UNIX 备份软件对此非常担心,以至于它只是拒绝再次写入磁带,直到磁带准备好被擦除为止;这来自阿曼达常见问题解答(其中特别提到总线重置是问题区域):

为什么 Amanda 没有将内容附加到磁带中?

一次 Amanda 运行 = 一盘(一套)磁带。Amanda 打开磁带设备一次,写入所有图像和文件标记,然后关闭设备一次。使用该序列,其他程序不可能在 Amanda 不知情的情况下中断序列并倒带。

执行“mt -f /dev/st0 status”就足够了,甚至执行“amcheck daily”。此外,像 scsi 总线重置这样的错误意味着倒带。

如果 Amanda 每次备份图像时都关闭并重新打开磁带驱动器,则磁带可能会意外倒带,下一个图像将覆盖磁带上所有良好的备份。除非您尝试从磁带恢复,否则您不会知道。

当将内容附加到磁带时,有这样的可能性:在 Amanda 定位到最后一个图像(这已经不是一件小事了)和打开设备进行写入之间,会发生磁带倒带,在这种情况下,Amanda 会很乐意擦除磁带上的所有内容,其中可能包含很多天的备份。

Bacula 也通过永不关闭磁带设备解决了这个问题,因此在磁带加载时其他人无法错误地打开它。但这并不能解决总线重置问题。

本质上,这一个问题,而且是一个难题。我可能会说,您的备份硬件应该足够坚固,这样就不会经常发生这种情况;如果 FC 似乎特别容易出现这种情况,那么是时候换一个 SAS 磁带驱动器了,或者至少将磁带设备直接连接到备份服务器,以便从路径中移除光纤交换机等。除此之外,我看不出您还能做更多的事情,因为您在通常的时间点之前就发现了问题,即“我们的恢复不起作用,我们完蛋了“。

相关内容