监控基于事件的 SLA 违规行为?(例如文件延迟)

监控基于事件的 SLA 违规行为?(例如文件延迟)

我们当前的 SLA 要求在特定时间范围内交付文件。我们有相当多的此类文件,它们在一天中的不同时间生成。

我知道 Site24x7 等外部监控网站可以监控特定服务的中断情况。例如,如果我们的 FTP 服务器出现故障,我们就会收到通知。

但是,是否有任何主机服务或基于服务器的软件可以监视我们的流程并在 (a) 预期事件延迟超过指定时间时以及 (b) 预期事件最终发生时生成通知?

我正在寻找这样的通知,“文件 XYZZY.DAT 预计在 91 分钟前发布,但现在仍未发布。”

答案1

每个常用的监控工具都可以做到这一点。请参阅 Zabbix、Zenoss、Icinga... 甚至愚蠢的自制脚本。对于 Zabbix,似乎您可以使用 trapper 来告诉 zabbix 有关脚本传递文件时发生的事件,然后您可以将其与简单检查相结合,以查看托管这些文件的服务器是否可远程访问。所有提到的应用程序都有仪表板,但也可以向邮件、电话、页面等发送警报。

相关内容