我需要帮助来设置基于网络吞吐量的自动缩放。
我们的前端实例放在一个自动缩放组内。我们希望实例数量随着整个自动缩放组的网络吞吐量而增加。即一旦达到阈值,就添加另一个实例。
目前我们的设置基于本教程:
- Cloudwatch 指标由一个名为的新指标组成,该指标等于(AutoScalingGroup) 与(AutoScalingGroup)
Network Total
的总和。NetworkIn
NetworkOut
- 该指标应该以 Gbit/s 为单位,但指标图中的 y 轴显示“无单位”。
- 我们的门槛——取自这一分析- 设置为字节/秒,因为 CloudWatch 指标以字节为单位。因此,对于 t3.small,0.13 Gbit/s 为 16.250.000 字节/秒(谷歌计算器)
- 一旦达到其总吞吐量的 80%,就会激活“实例增加”调度策略
NetworkTotal
。在 t3.small 案例中,1 分钟内为 0.13 Gbit/s(0.104 Gbit/s)的 80%。
鉴于我们当前的流量远高于阈值,我怀疑这些计算是错误的。问题可能出在从 Gbit/s 到 Bytes/s 的转换上,或者出在我们设置警报的方式上。
当然,任何其他方法也都欢迎:)
提前致谢。
答案1
警报应该向您显示一个图表,其中包含数学表达式的值以及您可以使用的阈值来查看它是否符合要求。
还可能是指标超出了阈值,但持续时间还不足以根据其周期长度和周期数触发警报。
不过,根据网络使用情况扩展 T3 有点棘手,因为它们具有突发的网络性能。当你进行负载测试时,你是否看到它们在 CPU/内存之前耗尽带宽?如果其他资源先耗尽,你可能希望根据瓶颈资源进行扩展