使用 Symantec Backup Exec 12 备份数据导致服务器崩溃,或者我如何开始厌恶讽刺

使用 Symantec Backup Exec 12 备份数据导致服务器崩溃,或者我如何开始厌恶讽刺

我有一台运行 Windows Server 2003 的 Dell PowerEdge 2850。它是我的一个客户的主文件服务器。我还有另一台运行 Windows Server 2003 的服务器,它充当 Symantec Backup Exec 12 的核心媒体服务器。

我最近从 Backup Exec 11d 升级到了 12。这次升级是必要的,因为我们刚刚从 Exchange 2003 升级到了 Exchange 2007。升级后,我必须将新版本 12 Backup Exec Remote Agents 推送安装到我正在备份的每台服务器(总共约 6 台)。我的 5 台服务器运行良好,每晚都能忠实地完成备份。我的文件服务器经常崩溃。

观察结果:

  • 当服务器崩溃时,它不会出现蓝屏,而是完全锁定。甚至鼠标也没有反应。如果服务器锁定的时间过长,它最终会自行重新启动并挂在 Windows 启动屏幕上。
  • 事件查看器中根本没有任何有用的问题证据。第二天早上,当我必须硬重置服务器才能启动时,日志从常规日志变成了无法解释的关机事件。
  • 90% 的情况下,服务器无法正常启动,而是卡在 Windows 启动屏幕上。我对此没有任何解释。当服务器卡住时,我所能做的就是硬重置它并重试。即使在成功启动和 chkdsk /r 操作后,如果您重新启动机器,则有 90% 的可能性它不会再次正常备份。

背景故事:

大约一个月前,这台服务器在夜间备份时开始崩溃。我尝试了所有能想到的方法来解决问题,但最终不得不放弃,因为我无法继续在凌晨 4 点到办公室尝试让服务器恢复在线。一个星期五,我很幸运,服务器在整个完整备份过程中保持在线。我借此机会将完整备份恢复到我设置的临时服务器,并将所有用户切换到临时服务器。然后我重新加载了有问题的文件服务器。

我将所有用户保留在临时文件服务器上大约 3 周。我在临时服务器上安装了与常规文件服务器上相同的 Backup Exec Remote Agent 和 Trend Micro A/V 客户端。在此期间,我完全没有遇到备份临时服务器的问题。

我对重新加载的文件服务器进行了广泛的测试。我每天每小时重启一次服务器,持续了 3 周,试图让它失败。它从来没有失败过。我相信重新加载可以解决我的问题。我把所有数据从临时服务器移回了常规服务器。我每晚都从中备份了 3 次,然后它又死机了,又出现了熟悉的无法正常启动的情况。

这个周末,我决定在整个备份作业过程中监控文件服务器。我通过 RDP 进入文件服务器,也进入运行 Backup Exec 的服务器。在文件服务器上,我打开了任务管理器,以便查看进程并观察 CPU 和内存使用情况。大约 60GB 的备份一切顺利。然后我注意到 Backup Exec 中备份作业的字节数已停止增长。我回头查看了文件服务器中的 RDP 会话,我仍然实时更新 CPU 和内存使用情况 - 两者都接近 0%,这很不寻常。备份作业期间,备份的使用率通常在 40% 左右徘徊。

让我重申这一点: 屏幕正在刷新,我正在获取任务管理器的实时更新- 直到我点击“开始”菜单。屏幕变黑,服务器锁定。事实上,我认为服务器已经锁定了,只是视频卡还没有弄清楚。

我又开始使用我的妙招:开车去办公室,当服务器在 Windows 启动画面上挂起时,我一遍又一遍地硬重置服务器。我这样做了 2 个小时,却没有成功启动。我开始惊慌失措,因为我没有一个像样的备份可以用来将所有内容恢复到正常工作的临时文件服务器上。

当我用尽所有我知道的方法后,我深吸了一口气,启动 Windows Server 2003 CD 并执行 Windows 的修复安装。服务器恢复正常,我的所有数据都完好无损。我现在可以随意重新启动服务器,它会干净地恢复。问题是,我担心一旦我再次尝试备份这些数据,我就会回到原点。

让我总结一下:

以下是我目前为排除该服务器故障所采取的措施:

  1. 删除并重新创建 RAID 5 组。初始化驱动器。使用全新安装的 Server 2003 重新加载服务器。
  2. 经戴尔确认,我已经安装了最新的、戴尔认可的 BIOS 和 NIC 驱动程序。
  3. 卸载/重新安装 Backup Exec Remote Agent。
  4. 卸载了 Trend Micro A/V 客户端。
  5. 配置服务器不是在蓝屏后重新启动,这样我就能查看任何停止错误。我以前以为服务器是蓝屏,但自从我启用此设置后,我现在知道服务器完全锁定了。
  6. 从 Windows 恢复控制台运行 chkdsk /r。发现并更正了几个错误,但对我的问题没有帮助。

帮助确认或否认以下假设:

  1. 这里有两个问题。首先,服务器为什么会锁定,其次,为什么服务器在锁定后无法正常启动。
  2. 这最终是一个软件问题。服务器运行良好,可以整天正常重启 - 直到第一次死机 - 在全新操作系统加载或甚至修复安装之后。
  3. 总体而言,这不是 Backup Exec 的问题。我的其他所有服务器都备份得很好。顺便说一下,其他所有服务器都运行 Server 2003,其中一些服务器存储的数据比这里讨论的文件服务器还多。

任何帮助我都会感激不尽。讽刺意味太强烈了。备份我的数据才是危及数据的原因。

答案1

Windows 启动画面上的挂起让我对您的 RAID 控制器固件或驱动程序产生了怀疑。它是 Dell PERC 吗?您目前使用的是固件和驱动程序吗?

最后成功备份的几个文件和目录有什么特殊之处吗(即,备份到该点的文件是否存在异常)?

您可以在文件服务器上的 Backup Exec 远程代理中打开调试日志记录,但如果文件系统或磁盘驱动器出现故障并崩溃,则可能无法写入调试日志。停止远程代理服务并使用服务属性上的“启动参数”文本框中指定的“-debug”参数启动它(假设您使用“服务”MMC 管理单元来执行此启动/停止)。如果您希望“-debug”设置永久生效,请将其添加到“HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\BackupExecAgentAccelerator”中的 ImagePath 值。

答案2

2011 年 11 月发布 - 试试这个:

1) 右键单击​​文件 C:\program files\symantec\SYMEVENT.SYS,然后选择“属性”>“版本”(选项卡)并记录版本信息。

2)下载 SymEvent 安装程序/更新程序: ftp://ftp.symantec.com/public/english_us_canada/symevnt/Sevinst.exe

3) 按照以下文章更新 SymEvent: http://www.symantec.com/business/support/index?page=content&id=TECH98521

摘录:
要在 Windows 2003/XP/2000/NT(包括服务器版本)上更新 Symevent 文件:
A. 从 Symantec FTP 站点下载 Sevinst.exe。将文件保存到硬盘上的文件夹中。B
. 打开命令提示符,然后转到下载 Sevinst.exe 文件的文件夹。C
. 根据程序版本,执行以下操作之一:

  • 在运行 Symantec AntiVirus 9.x 的计算机上或更高版本,输入以下命令:
    sevinst.exe /日志 SAVCE

  • 在运行 Symantec AntiVirus 8.x 的计算机上或更早,输入以下命令:
    sevinst.exe /log NAVNT


D、重新启动计算机

答案3

我在使用 Backup Exec 时也遇到过类似的问题(尽管是旧版本 10),我安装了最新更新,我的服务器在计划备份时或之后不久开始随机出现 BSOD。我从未确定问题的确切原因,但它似乎也与 TrendMicro 有关,并且它共同导致了内存保护故障。

我的解决方案是恢复到 oler Backup Exec 版本以及更新我的 TrendMicro(如果您使用 officescane,最近有一个新的主要版本发布)。

答案4

我怀疑是驱动程序问题。只是有过类似的经历。旧版应用程序使用 ISDN 调制解调器。我将其移至新计算机并下载了最新的调制解调器驱动程序。

ISDN 连接不断中断,我以为是调制解调器/线路的问题……但经过一番搜索,我用 6 年前的驱动程序替换了最新的驱动程序,从那时起它就一直没有问题。所以最新的驱动程序并不总是最好的 - 如果没有损坏就不要修复。

祝你好运!

相关内容