我正在 Sunfire x2200 中测试 2GB ECC Registered DIMM。最近,系统事件日志 (SEL) 开始在 CPU1 上填充最多的 DIMM 插槽上记录多位错误。当 CPU1 上有 8 个 DIMM 时,SEL 声称 CPU1DIMM7 上有多位错误。当 CPU1 上有 4 个 DIMM 时,它声称 CPU1DIMM3 上有多位错误。当只有 CPU0 填充时,这种情况根本不会发生。注意到这种模式后,我开始尝试我知道处于工作状态的 DIMM(由另一个工作系统验证),但结果仍然相同。
对我来说,这说明 CPU1 或主板有问题。但我们生产时需要两个 CPU,我不想将整个机器视为无法使用。除了更换 CPU 并重新测试该 CPU DIMM 插槽中的 DIMM 外,还有其他方法可以确认是 CPU 有问题,而不是主板有问题吗?恐怕这种情况可能存在某种我不熟悉的故障排除过程。如果有,请告诉我。