什么可能导致内核内存不足错误？

Question 1

检查日志消息中是否有内核内存不足终止程序的迹象，或者OOM killed检查的输出dmesg。这可能会给出哪些进程是 OOM 终止程序的目标的迹象。另请查看以下内容：

和

这个系统是做什么的？您是否同时耗尽了交换空间？根据您详细描述崩溃的外部链接，看起来问题出在 rsyslogd 上。在这种情况下，定期重启应用程序可能会很方便。

Answer

检查日志消息中是否有内核内存不足终止程序的迹象，或者OOM killed检查的输出dmesg。这可能会给出哪些进程是 OOM 终止程序的目标的迹象。另请查看以下内容：

和

这个系统是做什么的？您是否同时耗尽了交换空间？根据您详细描述崩溃的外部链接，看起来问题出在 rsyslogd 上。在这种情况下，定期重启应用程序可能会很方便。

Question 2

2.6.18 是一个非常老的内核。我遇到过一些问题，某些情况会触发内核无限循环，导致内存耗尽、I/O 带宽完全用尽等问题，从而无限循环地将相同的数据刷新到磁盘（这会导致负载峰值，但 CPU 使用率正常）。

这些错误往往在报告后不久就会得到修复，因此内核升级是修复此问题的简单方法 - 另外，升级内核意味着您可以免费获得一些安全修复 :-)

Answer

2.6.18 是一个非常老的内核。我遇到过一些问题，某些情况会触发内核无限循环，导致内存耗尽、I/O 带宽完全用尽等问题，从而无限循环地将相同的数据刷新到磁盘（这会导致负载峰值，但 CPU 使用率正常）。

这些错误往往在报告后不久就会得到修复，因此内核升级是修复此问题的简单方法 - 另外，升级内核意味着您可以免费获得一些安全修复 :-)

Question 3

另外要注意的是，不要忘记 Cacti 和类似的图表以一定的分辨率绘制（ collectd 默认为 5 秒，我相信 cacti 默认为 30 秒），因此您有 30-60 秒的时间不一定会显示在您的图表上...如果系统完全陷入困境，这也会影响数据收集守护进程。

您可能会在日志文件中找到其他有用的信息，无论是常规的 /var/log/messages 还是服务特定的 /var/log/apache2/error.log。

如果您不能，那么我建议您检查您的服务（我注意到上面的日志摘录中有 apache2）并验证它们是否能够导致服务器出现内存耗尽的情况。（例如：默认的 apache 配置，带有 mod_prefork 和 php 应该能够使您的系统停止运行）。

Answer

另外要注意的是，不要忘记 Cacti 和类似的图表以一定的分辨率绘制（ collectd 默认为 5 秒，我相信 cacti 默认为 30 秒），因此您有 30-60 秒的时间不一定会显示在您的图表上...如果系统完全陷入困境，这也会影响数据收集守护进程。

您可能会在日志文件中找到其他有用的信息，无论是常规的 /var/log/messages 还是服务特定的 /var/log/apache2/error.log。

如果您不能，那么我建议您检查您的服务（我注意到上面的日志摘录中有 apache2）并验证它们是否能够导致服务器出现内存耗尽的情况。（例如：默认的 apache 配置，带有 mod_prefork 和 php 应该能够使您的系统停止运行）。

更新：