我正在使用 Sensu 监控一些服务器,并安装了一些基本脚本来检查一切是否正常。目前我有:Apache Alive、SQL alive、SQL 复制链接、备份验证 RAM、CPU 和磁盘使用情况。
网络服务器上还有哪些其他东西会失败/无法按预期运行?最常见的故障是什么?谢谢
答案1
您基本上已经覆盖了关键区域。我通常会在 Web 服务器上监控以下内容:
Apache 进程、网站 HTTP 响应、SQL 数据库状态、可能还有交易计数、等待时间等...、SQL 复制状态、备份进程状态、RAM 使用率、磁盘空间可用百分比、CPU 负载
如果可以的话,监控日志文件中已知的错误消息也很常见,但是 Sensu 中的模板可能已经针对某些应用程序执行了此操作。