Cloudwatch 新鲜度检查,类似 Nagios 被动检查

Cloudwatch 新鲜度检查,类似 Nagios 被动检查

Nagios 有一项很好的功能,称为被动检查。您可以定义被动服务并配置“freshness_threshold”。这对于常规作业(即备份作业或类似作业)非常有用,管理员只需要在作业发生以下情况时收到警告:不是跑步。

因此,这就像一个“死人开关”一样有效。只要一切正常,管理员就不会收到任何警报。只有当作业在一定时间内没有运行时,才会触发警报。

我尝试在 AWS CloudWatch 中找到类似的功能,但没有成功。是否可以将 CloudWatch Alerts 配置为类似这样的工作方式?

答案1

这可以通过检查期、评估期和“处理缺失数据”选项的组合来实现。查看https://ruempler.eu/2017/06/26/dead-mans-switch-backup-alerting-aws-cloudwatch/以获取示例和 CloudFormation 片段。

答案2

您应该能够通过在定义警报阈值时选择“小于”符号,然后在任务运行时记录调用来做到这一点。

换句话说,如果您的指标在典型执行周期内下降到 0 次执行,则会触发警报。

相关内容