我的服务器负载似乎真的激增,而且很多时候服务器每晚同一时间(午夜左右)都会宕机。我大约有 20 个 cPanel 帐户托管在上面,我尝试了所有我知道的方法来查找问题的原因。
我尝试过的一些方法:
- 结合 /etc/httpd/domlogs 中找到的所有站点访问日志,在服务器关闭时未发现任何异常。
- 检查了 var/log 目录中的大多数其他日志,没有发现任何表明服务器关闭时出现问题的内容。
- 检查了 cron 日志,没有发现任何异常。见下文。昨晚 00:14,CPU 飙升至 7.5。
我还能检查什么?我如何才能真正监控以找出根本原因?
12 月 8 日 00:05:01 v1 crond[6082]: (root) CMD (/usr/local/cpanel/bin/dcpumon >/dev/null 2>&1)
12 月 8 日 00:05:01 v1 crond[6084]: (root) CMD (/usr/local/cpanel/whostmgr/bin/dnsqueue > /dev/null 2>&1)
12 月 8 日 00:10:01 v1 crond[6435]: (root) CMD (/usr/lib64/sa/sa1 1 1)
12 月 8 日 00:10:01 v1 crond[6436]: (root) CMD (/usr/local/cpanel/bin/dcpumon >/dev/null 2>&1)
12 月 8 日 00:15:12 v1 crond[6775]: (root) CMD (/usr/local/cpanel/scripts/autorepair recoverymgmt >/dev/null 2>&1)
十二月 8 00:15:12 v1 crond[6776]: (root) CMD (/usr/local/cpanel/scripts/recoverymgmt >/dev/null 2>&1) 十二月 8 00:15:12 v1 crond[6777]: (root) CMD (/usr/local/cpanel/bin/dbindex >/dev/null 2>&1)
12 月 8 日 00:15:12 v1 crond[6781]: (root) CMD (/usr/local/cpanel/bin/dcpumon >/dev/null 2>&1)
12 月 8 日 00:20:33 v1 crond[7047]: (root) CMD (/usr/lib64/sa/sa1 1 1)
答案1
虽然这是一个很广泛的问题,但您可以尝试以下方法来发现问题。
我首先确定的是,这是一个每天运行并产生问题的特定 cron。
然后首先启用 sar 日志记录,我相信您已经启用了它。如果没有,请启用它。
使用 sar 日志查找问题区域,例如检查磁盘使用情况、CPU 使用情况和内存使用情况,并尝试找出当时运行的任务导致的问题,例如它是否使用内存、磁盘或 CPU。虽然我相信应该是内存,但您却耗尽了内存,系统挂起了。
一旦您弄清楚了主要问题,请检查您当时正在运行的 cron 以及每天运行的 cron。
一旦你已经将几个特定的 cron 作业归零,现在就检查那些可能产生特定问题的 cron 作业,看看 cron 作业正在做什么。
希望通过这个,您可以找到问题所在。
答案2
请在 VPS 关闭的同时检查 cron 作业,它几乎就是备份或任何
每天同一时间运行的服务