如何从系统日志中找出系统挂起的原因?

如何从系统日志中找出系统挂起的原因?

我在 Amazon EC2 实例中运行 Ubuntu 10.04 LTS。

系统突然没有响应。当我检查日志文件时,我在 /var/log/syslog 中发现了以下错误

2 月 22 日 04:10:01 ip-10-0-1-12 CRON[16153]: (root) CMD (/usr/sbin/cm-sysmon) ^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@ ^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@ ^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@2 月 22 日 04:29:47 ip-10-0-1-12 内核:imklog 4.2.0,日志源 = /proc/kmsg 已启动。2 月 22 日 04:29:47 ip-10-0-1-12 rsyslogd:[origin software="rsyslogd" swVersion="4.2.0" x-pid="656" x-info="http://www.rsyslog.com"] (重新)启动 2 月 22 日 04:29:47 ip-10-0-1-12 rsyslogd:rsyslogd 的 groupid 已更改为 103 2 月 22 日 04:29:47 ip-10-0-1-12 rsyslogd:rsyslogd 的用户 ID 已更改为 101 2 月 22 日 04:29:47 ip-10-0-1-12 rsyslogd-2039:无法打开输出文件‘/dev/xconsole’[尝试http://www.rsyslog.com/e/2039] 2 月 22 日 04:29:47 ip-10-0-1-12 内核:[ 0.000000] 正在初始化 cgroup 子系统 cpuset 2 月 22 日 04:29:47 ip-10-0-1-12 内核:[ 0.000000] 正在初始化 cgroup 子系统 cpu

我们必须重新启动系统才能使其恢复正常。

我很惊讶地看到系统日志中的垃圾值。

/var/log/kern.log 或 /var/log/messages 中没有任何可疑内容。

我怎样才能查明那段时间出了什么问题?

答案1

这看起来像是 /usr/sbin/cm-sysmon 是重启之前 04:10:01 的最后一个命令。

04:29:47 时系统恢复正常运行,但连接控制台时出现问题。

我猜测后者是由于突然重启而导致的 EC2 问题。

最好的猜测是看看 /usr/sbin/cm-sysmon - 但这可能完全无害。

这些垃圾看起来像是写入系统日志的几个 0 值 - 可能是攻击或木马导致了这种情况。

相关内容