我们的客户遇到了一种情况,我希望更好地了解一下。
事情是这样的:
- 带有 LTO 磁带驱动器的库连接到光纤通道环境
- 在 Windows Server 2008 上运行的归档软件正在将数据写入磁带
- 在某个时候,磁带倒带了,但软件却没有意识到这一点,写入操作抹去了磁带上的内容
- 通过将磁带上的预期位置与实际位置进行比较来检测情况
我不知道设备供应商的详细信息。
看来磁带驱动器发生了重置,导致磁带倒带,但这种情况并没有作为错误报告给驱动程序和软件,因此软件假定写入成功。
我阅读了大量文档来了解为什么会发生这种情况,但我无法做出任何最终结论来帮助客户。
- FC HBA 或交换机能否自行重新传输总线重置时的 SCSI 写入?
- 这样的东西可以配置吗?
- FC HBA 或交换机是否忽略了报告的单元注意?
- 操作系统驱动程序是罪魁祸首吗?
- 这个是特定供应商的吗?
如果有人能给我提供一些继续的指导,我将非常感激。
答案1
这是磁带驱动器的一个已知问题,只需从侧面看该设备即可轻松倒带(即以错误的方式打开它 - 通过倒带设备 - 例如只是为了检查状态)。
至少有一种主要的 UNIX 备份软件对此非常担心,以至于它只是拒绝再次写入磁带,直到磁带准备好被擦除为止;这来自阿曼达常见问题解答(其中特别提到总线重置是问题区域):
为什么 Amanda 没有将内容附加到磁带中?
一次 Amanda 运行 = 一盘(一套)磁带。Amanda 打开磁带设备一次,写入所有图像和文件标记,然后关闭设备一次。使用该序列,其他程序不可能在 Amanda 不知情的情况下中断序列并倒带。
执行“mt -f /dev/st0 status”就足够了,甚至执行“amcheck daily”。此外,像 scsi 总线重置这样的错误意味着倒带。
如果 Amanda 每次备份图像时都关闭并重新打开磁带驱动器,则磁带可能会意外倒带,下一个图像将覆盖磁带上所有良好的备份。除非您尝试从磁带恢复,否则您不会知道。
当将内容附加到磁带时,有这样的可能性:在 Amanda 定位到最后一个图像(这已经不是一件小事了)和打开设备进行写入之间,会发生磁带倒带,在这种情况下,Amanda 会很乐意擦除磁带上的所有内容,其中可能包含很多天的备份。
Bacula 也通过永不关闭磁带设备解决了这个问题,因此在磁带加载时其他人无法错误地打开它。但这并不能解决总线重置问题。
本质上,这是一个问题,而且是一个难题。我可能会说,您的备份硬件应该足够坚固,这样就不会经常发生这种情况;如果 FC 似乎特别容易出现这种情况,那么是时候换一个 SAS 磁带驱动器了,或者至少将磁带设备直接连接到备份服务器,以便从路径中移除光纤交换机等。除此之外,我看不出您还能做更多的事情,因为您在通常的时间点之前就发现了问题,即“我们的恢复不起作用,我们完蛋了“。