多种指标的在线监控/仪表板服务

多种指标的在线监控/仪表板服务

我知道有 Uptimerobot 和 Pingdom 之类的服务可以监控网络服务正常运行时间。

我希望能够轻松监控网络可用性以及备份状态,例如备份是否正常运行/完成。我希望避免备份脚本用电子邮件填满我的收件箱,只需一个网页即可一目了然地查看所有指标。

我想知道是否有一个在线服务可以提供多个指标的仪表板视图,例如

  • 网络可用性/正常运行时间
  • 备份状态(是否运行、备份与源的大小等)
  • 其他网络服务器变量(负载、磁盘等)

有这样的事吗?

我猜想需要有一种方式通过 API 向服务提交数据,然后通过前端交通灯系统或其他易于使用的指示器来一目了然地查看状态。

谢谢!

答案1

Datadog 监控网络可用性、服务器性能、备份状态。https://www.datadoghq.com/

答案2

许多监控服务支持并提供代理来监控服务器上的各种属性,以及对他们本身不支持的事物/指标的自定义检查。

  1. 安装代理,您应该获得许多有用的指标。

此外,即使是基本的/简单的网站监控服务也允许您定义要检查的其他 URL。

考虑在您的网站上设置一个(受密码保护的)监控区域,您可以在其中部署简单的 Web 服务以进行此类自定义监控。

然后,例如让您的备份脚本记录日期/时间、成功或失败以及您认为对状态文件重要的任何其他信息,并创建一个解析该文件的简单 Web 服务,类似于下面的伪代码:

if ( modification_time( backup_log_file ) > 36 hours) 
then 
    send http_response_header = 500
    send http_response_body   = "RED: the last successful backup is more than 36 hours old"
fi

if ( backup_log_file  CONTAINS_STRING "success" )
then 
    send http_response_header = 200
    send http_response_body   = "GREEN: the last backup was successful"
else
    send http_response_header = 500
    send http_response_body   = "RED: the last backup failed"    
fi
 

相关内容