长期以来正常运行的备份工作突然在感恩节前后间歇性地出现故障,并且随着时间的推移情况越来越糟。现在它每天都在发生故障。我想我的磁带驱动器可能损坏了,但我对此并不完全确定。
备份软件 (ArcServe) 总是出现介质错误,而我的磁带没有品牌新品它们已被使用/擦除十五次或更少,并且被妥善存放。
磁带驱动器(Quantum LTO2 Half Height)使用的是最新固件版本,而 scsi HBA 和磁带驱动器都使用的是最新的 Windows OS 驱动程序。自问题出现以来,这些驱动程序版本一直没有更新,因为我首先查看的是驱动程序更新。
我使用名为 xTalk 的工具对磁带驱动器运行诊断测试,“驱动器健康”测试表明它没有问题。我运行了所有单独的诊断测试,除完整磁带备份外,所有测试都已完成。完整磁带备份在测试进行到 70-80% 左右时失败。它会抛出介质错误(ArcServe 会抛出相同的介质错误)。我的每日 Arcserve 备份也会在网络共享中失败,6 个中的 6 个,根据备份集,大约完成 70-80% 的作业。失败前完整磁带备份测试的 70-80% 与编写 Arcserve 作业的 70-80% 之间的模式非常吻合,但我不知道我是否能对我所看到的内容施加任何影响。我对这些事情没有经验。
值得注意的是,在两个月的测试中,磁带驱动器需要清洁才能运行我的测试。这些日期分别是 12/16/11、12/20/11、1/9/11 和 1/23/11。在 1/9/11,我用相同的固件重新刷新了磁带驱动器,并按照 Quantum 的建议连续运行了三次清洁。根据我的经验,一个功能正常的驱动器从来不会要求那么多清洁。我的清洁磁带很旧。在我之前它就在我公司了。但它并没有达到它声称的 50 次清洁次数。我认为磁带仍然可以正常清洁,因为当驱动器告诉我必须清洁它时,磁带放进去,清洁它的消息就会消失几天。
让我感到困惑的是,短磁带写入和中等长度磁带写入都完全没问题。但完整磁带和接近磁带末尾的部分却让我的驱动器感到不安。
因此,我订购了新磁带,目前正尝试在新磁带上进行完整的磁带备份。
在我的备份日志中,我也看到一些网络错误。因此,我不确定我是否遇到了备份共享在网络上丢失的问题,或者我是否遇到了硬件故障,或者两者兼而有之。
我希望之前去过那里的人能帮我把一些我在这里看不到的零件拼凑起来。如果我的驱动器损坏了,我不介意把它寄回去并付费修理。但是当它只在一种测试中失败,而设备健康测试表明设备没有问题时,就很难证明把磁带驱动器扔到邮件中是合理的。
希望有人能提供帮助。感谢您阅读我的帖子,祝您有美好的一天。
编辑 #1:我可以从由于介质错误而导致不完整的磁带中恢复。我可以将非常旧的磁带合并回数据库并从中恢复文件。甚至我的 Arcserve 日志也显示 e6918“您的磁带驱动器需要清洁”。所以这是我的磁带驱动器仍然可以做的几个“正常”磁带驱动器操作。这让我不那么认为是磁带驱动器损坏了,但持续的清洁让我感觉并非如此。
编辑 #2:1/27/12 - 我于 1/25/12 从收缩包装中取出一盘全新的 LTO2 磁带,并对其进行了完整的磁带备份测试,没有出现任何问题。我于 1/25/12 取出另一盘全新的 LTO2 磁带,并对其进行了完整的 arcserve 备份,没有出现任何问题。今天早上,我收到了新的 LTO2 清洁磁带,并对其进行了三次清洁。第一次清洁后,我检查了磁带清洁器的窗口,发现它并没有完全被污垢覆盖,因此我又对其进行了两次清洁,以防万一。然后,我打开了 xtalk 测试软件,没有出现“立即清洁磁带驱动器”警告,因此我决定取出之前出错的磁带并将其擦除,然后尝试进行完整的磁带备份。我已经写入了整个磁带的内容,并且正在验证写入操作。如果结果良好,那么我将能够做一些上周在写入操作期间会失败的事情。因此,这可能是一个好兆头,表明我的问题正在得到解决。难以相信一点点污垢会造成如此大的影响。
答案1
首先尝试更换清洁带(订购几条)。
清洁带的“50 次清洁”数字有点像汽车“每 10000 英里”更换机油:在理想条件下,这没问题,但并不能保证性能。如果你在破旧的驱动器中用清洁带清洁脏兮兮的旧磁头,它不会持续那么长时间:我见过清洁带在清洁后变成棕色一清洁周期,我肯定不会再使用它们 49 年。
您的磁带可能看干净,但将其与闪亮的新胶带放在一起,您可能会注意到令人惊讶的差异。
还要注意,“CLEAN ME”消息消失只是表示清洁周期已经完成——清洁消息(以及可能存在的介质错误)在“几天”后再次出现,而不是个月让我怀疑你的清洁磁带没有发挥作用(驱动器正在发现错误,这会触发它要求另一次清洁)。
如果使用新的清洁磁带并使用新的用于备份的磁带并不能解决问题,您可能需要对驱动器进行维修/更换。
我认为您的网络错误与此无关 - 介质错误通常由磁带驱动器引发,并且与任何网络问题无关。您可能希望就这些错误提出一个单独的问题(如果这样做,请尽可能具体:“网络错误”是那些毫无意义的短语之一,可以是“我无法打开与备份客户端的连接”到“我正在使用 ISCSI 与磁带驱动器通信,但它不工作!”)
答案2
从 5 月份开始,这台磁带驱动器再次出现故障。经确认是设备损坏。
我们用外部 USB 驱动器备份来代替磁带。整体设备成本便宜得多。
不幸的是,我关于可靠备份软件的问题被认为是可以解决的,我不得不编写一个超级批处理来处理新驱动器上的备份。这不是理想的,但它有效。