我可以检查什么来了解服务器无法访问的原因

我可以检查什么来了解服务器无法访问的原因

我有一台运行旧版本 Centos (5) 的服务器。大约每天一次,服务器无法访问,持续时间为 4-5 分钟,有时更长。几分钟后,服务器又可以访问。这很奇怪。

我检查了消息和安全,在无法访问时没有看到任何事情发生。例如,今天早上 7:50 左右我通过 ssh 登录。当我查看服务器时,我的终端挂了。于是我关闭了终端并尝试重新连接,但无法连接。我尝试(使用浏览器)访问该服务器上运行的网站,但无法连接。然后,大约 8:03,一切似乎都恢复正常。

我的问题是,我应该检查哪些日志、系统或文件来确定为什么这种情况会持续发生。顺便说一句,这种情况通常每天大约在同一时间发生。但并不完全如此。

谢谢您的任何提示或指点。

答案1

我最近刚刚安装sar(系统活动报告)在 CentOS 5 机器上,这样我就能知道当 Web 服务器停止响应请求时发生了什么。我还没有完全探索它(除了验证 cron 作业是否每 10 分钟记录一次系统信息),但这里有一些基本信息和指针。

根据sar 维基百科文章

sar(系统活动报告)是一个源自 Solaris 的系统监视命令,用于报告各种系统负载,包括 CPU 活动、内存/分页、设备负载、网络。

在 Linux 发行版中,它由包提供sysstat

使用 SAR 轻松监控系统IBM 的 对使用 进行了很好的介绍sar

Softpanorama 文章也是由 Sean Walberg (与上述作者相同) 撰写。

也可以看看:

相关内容