Munin 锁定 Ubuntu,处理时间过长。如何解决?

Munin 锁定 Ubuntu,处理时间过长。如何解决?

我一直搞不清楚这里发生了什么。我已将图表附在下面。正如您所看到的,进程似乎与 Munin 处理时间的增加同步增加。然后服务器锁定,图表消失。我已在 Munin IRC 频道中询问,但未找到任何答案。

Munin 的安装是使用标准 Ubuntu 软件包完成的,它监控两台服务器以及它自己,所以没有什么太夸张的。

您对导致这种情况的原因有什么想法吗?理想的解决方法是什么?

Munin 处理时间图表截图 Munin CPU 进程图截图 Munin CPU 图 IO 统计

答案1

你确定是 Munin 导致了这个问题,而不是简单地报告其他原因导致的问题吗?我这样说是因为 munin 似乎运行良好,报告称一天中大部分时间有 130 个休眠进程。然后在凌晨 2 点左右的半小时内,处于不间断休眠状态的进程开始增加。

您需要找出在此期间系统上发生了什么。如果这种情况经常发生,请尝试启动屏幕,然后对系统执行“ssh”。然后运行“while true; do ps awwlx; sleep 60 done”。这将导致每分钟发送正在运行的进程列表。然后,一旦它再次锁定,您就可以重新连接到屏幕并查看有哪些进程,理想情况下哪些进程处于“D”状态(不可中断的睡眠)。

还要查看其他图表,例如内存使用情况和磁盘 I/O。磁盘 I/O 是否超标?很可能是。内存使用量是否上升?系统是否在进行交换并崩溃?我的猜测是,您有某个或某些进程开始占用大量内存,导致系统进行交换并崩溃。“ps awwlx”应该会显示这一点,因为内存使用情况也会写出。

您可能想要在屏幕上运行的另一个程序是“vmstat 1”,它每秒显示一行有关系统使用情况的信息。特别有用的是“swap”和“CPU wa”数字。

相关内容