自上周以来,NAT 网关的使用量猛增。由于 AWS 账单现在相当高,我的任务是找到根本原因。
我首先采取的行动是询问其他人。没有人知道任何部署可能会导致此问题。
然后,我启用了流日志并使用 CloudWatch Insights 对访问 NAT 网关的 IP 进行排序,按数据量排序。大约有 6 个 IP 都解析到 CloudFront。我尝试匹配nslookup
我们traceroute
拥有的每个发行版以及我们管理的其他账户,但我无法匹配任何 IP。尝试对 API 网关中的 API 执行相同操作。同样没有成功。
我还能做什么来找出影响 NAT 网关的原因?该问题只发生在生产中,因此我不能简单地阻止 IP。我只有一堆与任何 ENI 无关的 IP。我检查了来自亚马逊的保留 IP,它们都在 CloudFront CIDR 中。