我的Debian 2.6.38-3
服务器出现了一些问题,每三个月就会崩溃一次,但我不知道原因。
根据 Pingdom 的数据显示该网站在凌晨 4 点左右瘫痪,但我查看的日志中均不包含任何有关任何类型错误的信息。
这是我查看过的日志文件:
- /var/log/消息
- /var/log/syslog
- /var/log/调试
- /var/log/kern.log
根据给出的日志,没有任何错误。以下是来自的一个例子/var/log/messages
。
1 月 21 日 04:01:46 debian god[1195]: 10 秒后应用程序仍处于活动状态;发送了 SIGKILL
1 月 21 日 11:18:20 debian 内核:imklog 3.18.6,日志源 = /proc/kmsg 已启动。
知道哪些日志可能包含我正在寻找的信息吗?
**崩溃,即对任何内容均不响应。屏幕变黑,不响应网络请求,我无法使用 SSH 访问它。*
答案1
遗憾的是,可能一个都做不到。当出现内核崩溃时,没有日志子系统可以写入日志,也没有文件句柄可以处理它们。
唯一可能的做法是将控制台重定向到 /dev/ttyS0 并设置另一台服务器来从那里记录输出。
这样,当内核崩溃时(如果发生了这种情况),您将能够通过串行端口从监控服务器跟踪日志。
答案2
SIGKILL 是某个人强行终止进程。我认为你需要一些深度监控。你需要持续监控内存、处理、SWAP、平均负载、进程数、僵尸进程以及正在运行的所有服务。这样你就能找到嫌疑人。我建议你安装 nagios 并监控以上所有内容。
希望您已经检查过 crontab、内核错误等等。
谢谢