我们使用 Nagios 插件 check_total_procs 来检查服务器上的进程总数。安装的默认设置如下:
command[check_total_procs]=/usr/lib/nagios/plugins/check_procs -w 150 -c 200
有了这些设置,我们几乎所有的服务器都处于警告(超过 150 个进程)或危急状态(超过 200 个进程)。这些服务器都是基于 Debian 的,主要是 Web 和数据库服务器。
我的问题是这些默认值是否是一个很好的基准?我是否应该担心我的大多数服务器似乎有超过 200 个正在运行的进程,或者对于运行标准 LAMP 堆栈的机器来说,这很正常吗?
答案1
每个服务器都是不同的 - 特别是 Web 服务器往往有很多进程,特别是在它们很繁忙的时候。
您能做的最好的事情就是在一周的正常运行时间内监控您的服务器,查看服务器中有多少个进程是正常的,然后适当地配置 Nagios。
不用理会这样的默认值,根本不存在典型的服务器!