我已将扩展触发器设置为查找不健康的主机数,但它似乎不起作用。
现在来测试一下——我通过 SSH 连接到我的一个实例并停止 HTTPD 服务。然后,当我导航到健康概览时,我会立即看到我通过 SSH 连接到的服务器现在处于严重状态。
我假设此时,经过 1 分钟(按照我的规则)后将创建一个新服务器,但事实并非如此。
如果我正确理解了我的规则 - 现在有 1 个(高于上限)不健康的服务器,因此我们将其增加 1。然后,一旦不健康的服务器数量为 0(低于下限),则删除 1 个服务器。
但是是的,我等了大约 5 分钟,并没有配置新的 EC2 服务器。
我还针对健康检查进行了一些设置:
这是否与我的自动缩放规则有冲突?我认为健康检查文件需要返回 200 响应才被视为健康,如果 HTTPD 停止 - 它们将不会返回该响应。
那么,到底发生了什么呢?
答案1
看起来您没有设置单位,但我认为该指标上不存在单位。您可以转到 CloudWatch 控制台并检查警报和指标,看看它们是否匹配。
但是,扩展 UnHealthyHostCount 也是一个坏主意。它只会启动一个新实例,而不会对不健康的实例采取任何措施。启用 ELB Healthchecks 通常是一个更好的主意。