（如何）我可以使用 syslog 来诊断神秘的崩溃？

Question 1

同意，apache2 是个糟糕的进程，但它以前一直是我的罪魁祸首。通常，尤其是 perl、php 或 mod_python 会不断为某些 Web 应用程序分配内存。随着不同的客户端访问不同的 apache 进程，它们的内存利用率会不断增加。

如果您的流量刚好足以让 Apache 进程保持活动状态，则最终可能会有 256 个 Apache 进程在运行。但是，它不必接近此限制，我曾经遇到过 oom-killer 让我度过了糟糕的一天，因为 30 个 Apache 进程每个使用了 250-300MB 或内存。

增加交换空间会为你赢得一些时间，让你能够进入机器并查看发生了什么，但是你需要得到警告，这样你才能看到哪个进程正在消耗内存，并验证它是否确实是 apache。

在 cron 作业或 cacti 和 snmp 中使用 free 并设置阈值。使用 free，您需要监视缓冲区和可用内存，计算总和并在某些最低阈值时发出警报。

另一件事，如果是 Apache，可能是要增加 MaxClients，它可以有一个较高的默认数字。或者，将 MaxRequestsPerChild 设置为足够低的数字，以便不时地终止进程。这只是一个创可贴，但它可以帮助您坚持足够长的时间来找出问题。

我只是在空中刺了一下 Scott M

Answer

同意，apache2 是个糟糕的进程，但它以前一直是我的罪魁祸首。通常，尤其是 perl、php 或 mod_python 会不断为某些 Web 应用程序分配内存。随着不同的客户端访问不同的 apache 进程，它们的内存利用率会不断增加。

如果您的流量刚好足以让 Apache 进程保持活动状态，则最终可能会有 256 个 Apache 进程在运行。但是，它不必接近此限制，我曾经遇到过 oom-killer 让我度过了糟糕的一天，因为 30 个 Apache 进程每个使用了 250-300MB 或内存。

增加交换空间会为你赢得一些时间，让你能够进入机器并查看发生了什么，但是你需要得到警告，这样你才能看到哪个进程正在消耗内存，并验证它是否确实是 apache。

在 cron 作业或 cacti 和 snmp 中使用 free 并设置阈值。使用 free，您需要监视缓冲区和可用内存，计算总和并在某些最低阈值时发出警报。

另一件事，如果是 Apache，可能是要增加 MaxClients，它可以有一个较高的默认数字。或者，将 MaxRequestsPerChild 设置为足够低的数字，以便不时地终止进程。这只是一个创可贴，但它可以帮助您坚持足够长的时间来找出问题。

我只是在空中刺了一下 Scott M

Question 2

有些东西试图分配比你拥有的更多的内存。你显然可以添加更多的交换，但这会降低你的机器的性能。也许可以添加一些定期运行的小脚本[甚至每分钟运行一次以上]

date >> /some/file
ps faux >> /some/file

并记录输出 - 您可能会发现进程分配了越来越多的内存。

Answer

有些东西试图分配比你拥有的更多的内存。你显然可以添加更多的交换，但这会降低你的机器的性能。也许可以添加一些定期运行的小脚本[甚至每分钟运行一次以上]

date >> /some/file
ps faux >> /some/file

并记录输出 - 您可能会发现进程分配了越来越多的内存。

Question 3

@user36376 的建议很好。看起来您有内存泄漏。在追踪到泄漏之前，调整 apache 以在处理一定数量的请求后终止进程可能会给您一些时间来识别泄漏。由于这是新出现的，因此应该怀疑是最近的变化。您可能还想考虑使用 ulimit 来最小化 apache 子进程的大小。泄漏的内存很可能可以在影响不大的情况下被换出，因此增加交换可能会有所帮助。

考虑使用 top 来监控虚拟映像大小。您可以更改顺序，使虚拟大小成为第一个排序字段。最大的程序将浮动到顶部。

Answer

@user36376 的建议很好。看起来您有内存泄漏。在追踪到泄漏之前，调整 apache 以在处理一定数量的请求后终止进程可能会给您一些时间来识别泄漏。由于这是新出现的，因此应该怀疑是最近的变化。您可能还想考虑使用 ulimit 来最小化 apache 子进程的大小。泄漏的内存很可能可以在影响不大的情况下被换出，因此增加交换可能会有所帮助。

考虑使用 top 来监控虚拟映像大小。您可以更改顺序，使虚拟大小成为第一个排序字段。最大的程序将浮动到顶部。

（如何）我可以使用 syslog 来诊断神秘的崩溃？

答案1

答案2

答案3

相关内容