我的 Supermicro 刀片服务器自行关闭并显示以下日志。可能是什么原因? (据我所知没有人碰过它!)
- 事件发生前几个小时,CPU 使用率约为 50%。
- 这个问题在过去几周发生过几次,都是在系统负载相似的情况下发生的。
- BIOS 事件日志中没有高温(或其他任何内容)条目。
- IPMI 日志中没有注册任何事件
- CentOS Linux 版本 7.5.1804,内核 3.10.0-862.6.3.el7.x86_64
09:04:30 hostname ***some event***
09:30:52 hostname systemd-logind: Power key pressed.
09:30:52 hostname systemd-logind: Power key pressed.
09:30:52 hostname systemd-logind: Powering Off...
09:30:52 hostname systemd-logind: System is powering down.
09:30:52 hostname systemd-logind: Powering Off...
09:30:52 hostname systemd-logind: System is powering down.
09:30:52 hostname systemd: Stopping Authorization Manager...
09:30:52 hostname systemd: Stopping Authorization Manager...
答案1
最明显的答案当然是有人按下了电源按钮。可能是意外 - 例如,如果电源按钮不幸很敏感并且有人在走过时轻微碰撞了它。电源按钮故障(例如弹簧磨损)也可能会发生这种情况。意外按下电源按钮可以通过制作某种莫莉守卫安装在电源按钮上。
例如,从 IPMI 请求正常关闭通常也会在按下电源按钮时进行注册。
另一种可能性是(电气)噪声使系统思考已按下电源按钮。确保电源按钮的电线牢固地固定在电路板上(以及开关,如果没有焊接),并检查电缆布线以确保电线远离任何具有大/可变功耗的物体。
如果其他都不起作用,您可以编辑/etc/systemd/logind.conf
并更改HandlePowerKey
为ignore
(然后重新启动systemd-logind)。这应该会阻止系统关闭,但这确实意味着您将无法使用电源按钮来启动干净关闭(按住 4 秒的不干净关闭,如果有的话,无法禁用)通过 systemd,因为它是由系统固件完成的)。