我们在美国一家知名的托管服务提供商处部署了两台 Dell R900 服务器。其中一台 Dell R900 服务器的 128 GB 内存(32x 4 GB)已更换 6 次。每次服务器机箱都会向 Dell OpenManage 6.5 报告不同位置的内存 ECC 故障。
我们已经更换了整个机箱(包括处理器)两次,并将其送到戴尔进行诊断,他们声称没有发现问题。
有没有人经历过类似的事情并且可能知道为什么机箱显示器和 OpenManage 无法就故障存储库位置达成一致?
答案1
当前 BIOS 应为 1.2.0这听起来好像 W2K8SP2 包含比当前 BIOS 更新的 Intel-Microcode-Update - 或者 W2K8R2SP1 降级为有故障的微码...戴尔不知道操作系统可能会改变这一点。
答案2
大多数企业级 BIOS 中都有一个支持特定制造商 PN 的列表。我曾见过更新删除了某个 PN,之后您就会遇到奇怪的内存问题。