服务器崩溃诊断...是否有任何“黑匣子记录器”风格的程序可用

Question 1

这是安排 cron.daily 作业的时间，因此我将首先查看 /etc/cron.daily 或每周或每月

你可以安装 atop，它将每 10 分钟记录一次进程快照

或者，您可以安装 psacct 并使用 accton 和 lastcomm 来查看正在执行的内容

开启审计也是一个选项，请参阅 auditd(8)

Answer

这是安排 cron.daily 作业的时间，因此我将首先查看 /etc/cron.daily 或每周或每月

你可以安装 atop，它将每 10 分钟记录一次进程快照

或者，您可以安装 psacct 并使用 accton 和 lastcomm 来查看正在执行的内容

开启审计也是一个选项，请参阅 auditd(8)

Question 2

您可以启用核心转储，当服务器崩溃时，它会将系统内存复制到文件中。

下一个问题是如何处理核心转储文件...如果您周围有人了解 gdb，他们也许能够做些什么...或者您可能能够使用“strings”命令从核心转储文件转储出所有文本，也许您就能找到一些东西。

Answer

您可以启用核心转储，当服务器崩溃时，它会将系统内存复制到文件中。

下一个问题是如何处理核心转储文件...如果您周围有人了解 gdb，他们也许能够做些什么...或者您可能能够使用“strings”命令从核心转储文件转储出所有文本，也许您就能找到一些东西。

Question 3

登录到连接良好的另一个框，运行 screen，通过 ssh 进入服务器，并在单独的 screen 窗口上跟踪 kern.log、daemon.log、syslog 和消息。（control-A、c 创建新窗口，Control-A、D 分离，screen -r 恢复）

当服务器再次锁定时，您应该在屏幕会话中拥有日志的尾部，即使在机器挂起时它们还没有被正确地刷新到磁盘。

如果你怀疑出现内核崩溃或错误

内核.panic=5 内核.panic_on_oops=5

在您的 sysctl.conf 或等效文件中将等待 5 秒钟，可能允许驱动器刷新，然后重新启动。

Answer

登录到连接良好的另一个框，运行 screen，通过 ssh 进入服务器，并在单独的 screen 窗口上跟踪 kern.log、daemon.log、syslog 和消息。（control-A、c 创建新窗口，Control-A、D 分离，screen -r 恢复）

当服务器再次锁定时，您应该在屏幕会话中拥有日志的尾部，即使在机器挂起时它们还没有被正确地刷新到磁盘。

如果你怀疑出现内核崩溃或错误

内核.panic=5 内核.panic_on_oops=5

在您的 sysctl.conf 或等效文件中将等待 5 秒钟，可能允许驱动器刷新，然后重新启动。

相关内容