运行 Windows Server 2000 的 HP ProLiant DL380 G3 在过去 5 天的早上 6 点到 7 点半之间崩溃

运行 Windows Server 2000 的 HP ProLiant DL380 G3 在过去 5 天的早上 6 点到 7 点半之间崩溃

我有一台运行 Windows Server 2000 的 HP ProLiant DL380 G3,每天早上 6-7:30 之间都会崩溃。这是在我 6 天前更换故障硬盘时发生的。我查看了计划任务,其中没有任何与此问题相关的内容。以下是我在系统日志和一些转储文件中看到的唯一内容。如果这种情况每天在某个时间段发生,这可能是硬件问题吗?任何帮助都非常感谢。谢谢

上次系统关闭时间为 2012 年 2 月 7 日上午 6:07:55,是意外事件。

系统信息代理:健康:服务器再次运行。该服务器之前已通过自动服务器恢复 (ASR) 功能关闭,并且刚刚再次运行。[SNMP TRAP:CPQHLTH.MIB 中的 6025]

错误检查 7A,{3,c0000005,3400028,0}

可能由以下原因造成:memory_corruption(nt!MiMakeSystemAddressValidPfn+42)

后续:MachineOwner

分析-v


  • *
  • 错误检测分析 *
  • *

KERNEL_DATA_INPAGE_ERROR (7a) 无法读取请求的内核数据页。通常由分页文件中的坏块或磁盘控制器错误引起。另请参阅 KERNEL_STACK_INPAGE_ERROR。如果错误状态为 0xC000000E、0xC000009C、0xC000009D 或 0xC0000185,则表示磁盘子系统发生故障。如果错误状态为 0xC000009A,则表示请求失败,因为文件系统无法继续前进。参数:Arg1:00000003,持有的锁类型(值 1、2、3 或 PTE 地址)Arg2:c0000005,错误状态(通常为 i/o 状态代码)Arg3:03400028,当前进程(锁类型 3 的虚拟地址或 PTE)Arg4:00000000,无法分页的虚拟地址(如果 arg1 是 PTE 地址,则为 PTE 内容)

模块名称:nt

IMAGE_NAME:内存损坏


错误检查 A,{0, 2, 1, 804137d6}

可能由以下原因引起:ntkrnlmp.exe(nt!CcGetVirtualAddress+ba)


  • *
  • 错误检测分析 *
  • *

IRQL_NOT_LESS_OR_EQUAL (a) 尝试在过高的中断请求级别 (IRQL) 上访问可分页(或完全无效)的地址。这通常是由驱动程序使用不正确的地址引起的。如果内核调试器可用,请获取堆栈回溯。参数:Arg1:00000000,引用的内存Arg2:00000002,IRQLArg3:00000001,位域:位 0:值 0 = 读取操作,1 = 写入操作位 3:值 0 = 不是执行操作,1 = 执行操作(仅在支持此状态级别的芯片上)Arg4:804137d6,引用内存的地址

模块名称:nt

图像名称:ntkrnlmp.exe

答案1

首先要明白的是,微软不再支持 Windows 2000。新的安全漏洞不再得到修补。此服务器上的 Windows Update 现在毫无意义。仅凭这一点就意味着,无论如何,早就该放弃这台服务器了。

需要考虑的第二件事是,考虑到时间的一致性,您可能需要检查在此期间系统上所有处于活动状态的计划任务。还要考虑其他环境因素 — 实际上,任何在一天中的某个时间增加服务器负载的因素都可能使刚开始出现故障的硬件陷入困境。

这引出了下一件事:考虑到设备的使用年限,很可能只是像旧 RAM 棒一样的东西出了问题,尤其是您的错误之一是内存损坏。但同样,这确实表明这台服务器已经过了使用寿命,应该更换,因为即使您发现并纠正了这个问题,您很可能很快就会再有一台。

答案2

是时候更新了。看看我的此处评论在以下问题中:HP DL380 G3 2U 基本网络服务器(2012 年)最好的系统管理员 WTF?

由于您使用的是 9 年前的硬件,因此通常存在组件故障的风险。不过,这个特定问题可能与固件有关。请确保您运行的是最新的适用于 Windows 2000 + DL380 G3 的最新固件. 特别注意系统 BIOS 版本智能阵列控制器(5i?5300?641?6400?)。看看现在是否有区别。

相关内容