我的 Windows Server 2008 R2 x64 计算机上个月出现过两次蓝屏。两次报告的 STOP 原因都是 MEMORY_MANAGEMENT 错误,参数 1 的值为 41790(“发生未知内存管理错误”,根据官方文档)。
这是一台全新的机器,具有 4 GB RAM,运行 IIS 和 SQL Server 2008。工作量很轻。
你知道可能出了什么问题吗?这种故障最常见的原因是什么?你会采用什么诊断策略?
谢谢!
编辑。我按照建议对机器进行了一些内存测试。所有测试都通过了,没有发现任何问题。我们最近对 BIOS 中的启动延迟进行了一些调整,以便机器中的 RAID 控制器有时间在服务器尝试查找操作系统之前初始化所有磁盘,从那以后我们就再也没有看到过蓝屏。也许就是这样?
答案1
这可能是由内存条故障、主板故障和驱动程序问题引起的。
让我们了解您的硬件的品牌和型号,我们可能会提供特定的工具和方法来帮助您排除故障。
首先,我要验证您的驱动程序是否一切正常。如果您的服务器是 HP,并且您从 smartstart CD 构建它,则驱动程序应该是正宗的,可以(暂时)排除。
另一方面,如果您手动下载并安装了所有驱动程序,或者使用默认的 Windows 驱动程序,请更新它们。
一旦对驱动程序的简单测试用完,就对 RAM 进行压力测试。同样,您的供应商可能会提供此工具(HP 的工具在服务器附带的 CD 上)。一些供应商在 BIOS 菜单中内置了测试器。
如果这两种解决方案都无效,那么请发布一些有关硬件和构建方法的更多信息,我们可以从那里开始。
答案2
我会跑记忆测试全面测试您的 RAM 是否存在硬件问题。
答案3
这肯定看起来像是模块故障、模块安装不当或制造缺陷。这甚至可能表明您的服务器存在冷却问题,尽管这通常会导致其他东西而不是 RAM 出现故障。还有一种可能是有人错误配置了 BIOS 设置,因此值得根据服务器制造商对安装的 RAM 类型和数量的建议进行检查,以确保万无一失。
我安装了很多服务器,我总是确保有一个很长的Memtest86+在我签署任何产品之前,我会对其进行磨合(24 小时或更长时间)。在这几年中,我曾看到两批不同的服务器(总共约 50 台)出现故障,这两次都是制造质量控制问题(在我看来),所以如果您认为这是由于缺陷导致的,我一点也不会感到惊讶。
哦,对于现代硬件,请确保您使用的是 Memtest86+。原始的 Memtest86 仍然存在,但不足以测试具有大量 RAM 的当前一代硬件。