一台服务器每隔几天就会重新启动,似乎是完全随机的。在重新启动之前,任何日志中都没有提到任何错误。例如,重新启动发生在来自/var/log/messages
和 的这 2 条消息之间journalctl
:
Mar 13 11:25:01 server something: some action
Mar 13 14:33:00 server rsyslogd: [origin software="rsyslogd" swVersion="8.4.2" x-pid="2460" x-info="http://www.rsyslog.com"] start
我能找到的唯一线索是重启后,在启动的某个地方它会喷出这个 IPMI 行:
Mar 13 14:33:00 server kernel: [ 24.621566] Copyright (C) 2004 MontaVista Software - IPMI Powerdown via sys_reboot.
所有其他 IPMI 和其他消息似乎都正常。此服务器的主板是 Intel S5000PSL。一些输出来自ipmitool
:
# ipmitool mc watchdog get
Watchdog Timer Use: BIOS FRB2 (0x01)
Watchdog Timer Is: Stopped
Watchdog Timer Actions: Hard Reset (0x01)
Pre-timeout interval: 0 seconds
Timer Expiration Flags: 0x00
Initial Countdown: 0 sec
Present Countdown: 0 sec
IPMI 是否保留我不知道的其他日志?如果是,我该如何访问它们?
答案1
我遇到了完全相同的问题,下一步是通过串行控制台登录到另一台机器,但没有任何结果。最终的解决方案是向供应商提出支持请求。我换了新主板,从此一切都正常了。