如何查找linux系统运行不正常的原因？

Question

检查以下文件

/var/log/syslog
/var/log/httpd/error_log

还有一个 gui系统日志查看器是否可以登录图形界面。

您提到这种情况会持续几分钟。这可能表明服务器实际上崩溃并自行重启。使用以下命令查看是否确实发生这种情况

last reboot

如果服务器确实重新启动，您将看到如下行

reboot   system boot  3.2.0-0.bpo.3-68 Fri Nov  2 18:25 - 21:46  (03:20)

也可以尝试

last -x

下一步 1

查看/var/log/syslog查找异常期间的进程崩溃/终止和内核消息。这可能会提供更多线索。

下一步 2

如果您无法坐在服务器前面等待它发生，以下是最后一种方法。谨慎使用

在/etc/crontab，添加以下行

#* * * * * root /usr/bin/top -b -n 1 | /usr/bin/head -n 15 >> /var/log/top.log

每 1 分钟，它将附加系统摘要，其中包含前 8 个最高 CPU 进程到/var/log/top.log。

前面有 # 表示禁用。删除 # 即可启用。如果要让它运行一整夜，您可能需要将该路径更改为有足够空间的地方。

恢复连接后立即禁用它 通过放回 # 或删除该行来禁用它。

检查 /usr/bin/top 和 /usr/bin/head 是否是两个命令的正确路径。

Answer 1