我有 2 台新的 HP dl380g5 服务器,运行已修补至 219382 的 HP esxi4。它们都已修补至最新的 hp 固件级别(固件 cd 8.7)
两者都运行 32gb(4 x 8gb 内存条)
两台服务器都出现了同样的症状 - 服务器前端的两个(随机)DIMM 的内存灯亮起,并且健康指示灯变为红色。有时服务器可以保持正常运行。其他时候,服务器会死机,只有重置电源才能恢复。
iLO 日志中没有显示任何内容,vmware 硬件监控中也没有显示任何内容。内存已被替换
我有其他客户在 esx3.5 上运行 dl380g5 并且没有任何问题 - 这是我们第一次与他们合作进行 vsphere 部署。
这些即将上线,所以任何建议都很有用。
提前致谢。
答案1
一些东西;
你说它们是新的,但 G5 是旧型号,你是买的二手货吗?内存是 HP 品牌的还是二手的?是用 HP 内存替换的吗?
另外,您使用的是 SmartStart 8.7,但您使用的是哪种系统固件(BIOS),G5 的最新版本是“2009.07.10 10 Sep 2009”,您的 iLO 是否是 1.78?
您是否已使用 HP 进行记录?
奇怪的是,两台机器都出现了这种情况,我们发现 380G5 也很稳定。
答案2
我在 DL380 G5 上看到过类似的问题 - 内存灯亮起,大概表示内存错误,但幸运的是没有其他症状。
在其中一台机器上,我们将其从 vSphere 集群中取出并运行内存检查 MemTest86 - 这并没有发现任何问题,尽管橙色灯又亮了。几天后检查时,灯又熄灭了,并且在过去一个月内没有再亮过。
我们刚刚看到另一台类似的机器,其中一个 HP DIMM(8x4GB 配置)的内存指示灯亮起。我们会告诉您我们如何调查此事。由于我们没有看到任何其他症状,因此这并不是我们的首要任务,因此可能还需要一段时间!