Apache 会随机崩溃。在日志文件中找不到原因

Apache 会随机崩溃。在日志文件中找不到原因

我们在 ubuntu 8.04 上运行 plesk 9.5 的 VPS 上遇到了问题,Apache 似乎会随机消失,需要手动启动。我检查了 apache 错误日志、/var/log/messages、各个虚拟主机 apache 错误文件,找不到与故障时间相符的任何内容。dmesg 为空,这有点奇怪。

我们的 psa 服务也曾无缘无故宕机,但 apache 服务仍正常运行。

我真的不知道该如何诊断,因为我能找到的所有日志文件都没有指出任何问题。还有其他我可以查看的吗?

内存使用率约为 55% (总共 400mb),而且这不是一个流量特别大的服务器。

如果您能告诉我在哪里可以找到正在发生的事情,我将非常感激。

缺口

更新:

我已经运行 watchdog 一段时间了,当进程停止时,它会重新启动进程。不幸的是,停止的往往不止是 apache(尽管有时只是 apache)。这似乎没有规律。我们还发现 courier 和 qmail 停止了。无论如何,我已经提高了 apache 的日志记录级别,并注意到以下情况

[Mon Mar 07 16:46:14 2011] [info] server seems busy, (you may need to increase StartServers, or Min/MaxSpareServers), spawning 8 children, there are 0 idle, and 21 total children
[Mon Mar 07 16:49:56 2011] [info] server seems busy, (you may need to increase StartServers, or Min/MaxSpareServers), spawning 8 children, there are 0 idle, and 12 total children
[Mon Mar 07 16:50:08 2011] [info] server seems busy, (you may need to increase StartServers, or Min/MaxSpareServers), spawning 8 children, there are 0 idle, and 28 total children
[Mon Mar 07 16:50:09 2011] [info] server seems busy, (you may need to increase StartServers, or Min/MaxSpareServers), spawning 16 children, there are 0 idle, and 36 total children
[Mon Mar 07 16:50:14 2011] [info] [client ipaddressofserver] (32)Broken pipe: core_output_filter: writing data to the network
[Mon Mar 07 16:50:14 2011] [info] removed PID file /var/run/apache2.pid (pid=9556)
[Mon Mar 07 16:50:14 2011] [notice] caught SIGWINCH, shutting down gracefully
[Mon Mar 07 16:50:18 2011] [emerg] (22)Invalid argument: mod_fcgid: can't get lock, pid: 9557
[Mon Mar 07 16:50:24 2011] [info] Init: Seeding PRNG with 0 bytes of entropy

我已经慢慢地增加了 minmaxspareservers,并密切关注内存使用情况。这肯定不会导致 apache、courier 和 qmail 失败吧?

任何有关日志条目及其含义的帮助都将不胜感激

干杯,尼克

答案1

我建议您通过终端登录服务器,运行 {screen} 并以前台模式运行 httpd。如果它崩溃了,控制台消息中应该会有一些线索。

当然,为了获得最佳效果,首先要man screenman httpd

高血压

答案2

您还可以尝试增加日志级别在错误日志中捕获更多详细信息。如果流量不大,您可以立即将其增加到“调试”。

答案3

您的 VPS 是否可能达到峰值限制?如果您在 Virtuozzo 下运行,并且有 UBC 限制,您可以检查/proc/user_beancounters文件 -失败列不应有任何非零值。此外,您还可以设置看门狗系统监控模块在 Plesk 中,自动启动关闭的服务。

相关内容