在具有 4 个节点的 Dell C6220 服务器上,有时会发生所有 4 个节点都断电的情况。这种情况似乎发生在电源出现轻微波动时(尽管两个电源上都有 UPS,但实际上 2 个 PSU 有 2 个不同的 UPS)。
同一 UPS 上还有另外 5 台服务器(其他型号,不是 C6220),此刻均未关闭。
系统日志中的消息是:
2018/01/31 12:21:10 System ACPI Power State Sys Pwr Monitor S5/G2: soft-off
无法使用电源按钮或软件打开任何节点。 重新打开它们的唯一方法是从两个电源装置上拔下电源线并将其重新插入。
这与帖子中描述的行为相同在戴尔论坛上但是,该帖子上没有答案/解决方案。
有什么方法可以避免这种情况吗?这种行为的原因是什么?我的其他服务器都没有关闭。诚然,存在轻微的电源问题(可能断电 0.5 秒),但有了 2 个独立的 UPS,我预计至少其中一个不会将断电转发给服务器,即使其中一个出现故障。
C6220 上有许多电源配置选项。设置方法如下:
Power Management <NodeManager>
Chassis Power Management > Chassis PSU Configuration
Required Power Supplies: 1
Redundant Power Supplies: 1
Power Capping
Chassis Level Capping: Enabled
Emergency Throttling
Sled Level Policy: Chassis Level
Chassis Level Policy: Throttling
所有 4 个节点上的这些设置都是相同的。
BIOS 版本 2.5.3
BMC 版本 2.59