过去几天,我一直在设置一台二手的 Dell PowerEdge 2950 服务器。它一直运行良好,直到刚才,在运行一个相当繁重的任务时突然停止运行 ( svnadmin verify
)。LCD 上显示以下消息:
PowerEdge 2950 E1422 CPU Machine Chk E2118 Fatal NB Mem CRC
现在,内存错误 E2118 似乎很简单。其中一个存储体可能坏了。我现在正在运行内存测试。 更新:嗯,memtest 没有发现任何错误,所以不是那简单的。
E1422,不太明显。这可能是一个单独的问题,还是只是 E2118 的结果?谷歌搜索此代码会显示“更新 BIOS”,但结果并没有明确指出问题的原因。
答案1
答案2
如果 CPU 或内存出现问题(例如电压调节问题),则可能会导致内存和 CPU 之间共享总线上的电压下降,从而使两者均发生故障。上周,我阅读了不同型号的戴尔服务器(可能是 R710)的一些发行说明,其中的问题可能是由 Intel SpeedStep 改变 CPU 速度以及内存调整速度之前存在延迟引起的。这造成了两者之间可能存在故障的情况。在这种特殊情况下,BIOS 更新解决了该问题。
运行 CPU 基准测试和内存基准测试,看看是否可以重现故障。如果可以,也许您可以将问题缩小到某个组件。