我为此苦思冥想了好几个月,没有答案,没有信息,没有“治愈方法”。
我的 AWS ELB 监听器“随机”忘记了 SSL 设置,并在随机时间自行恢复到此设置,无需任何人工干预。每次我修复它时,它都会保留 3、5、10 天,然后突然恢复到 TCP,使整个网站离线。我迫切想知道到底发生了什么。
它会自动恢复到以下状态:
这就是我一次又一次修复它的方法...一次又一次...却只看到它一次又一次随机地恢复到这种不工作的状态。
这不是安全漏洞。我们已通过查看日志、更改密码和将单个管理员帐户分配给一个人来验证这一点。这似乎是 AWS 的问题,我们对此没有答案。我们不会聘请“夜班警卫”来监视 ELB 管理面板,看看 AWS 何时自行忘记 SSL 证书......我们正在认真考虑放弃 AWS 来解决这个令人震惊的问题。
答案1
我敢打赌你一定有某种自动化弄乱设置。有些ansible,改造地形,拉姆达或者计划不时运行的自定义脚本,将 ELB 配置恢复到(大概是)原始状态。
查看云Trail发生时记录 - 您将看到哪些IAM 用户或者IAM 角色对 ELB 进行了更改。
您还可以启用AWS Config它实际上会创建所有资源的目录并跟踪更改。每当资源发生变化时,它都会提醒您(通过 SNS 或电子邮件)。
为了在 ELB 出现问题并导致网站崩溃时尽快发现问题,您还可以设置CloudWatch 警报取决于 ELB 流量或连接错误,或者问题再次出现时发生变化的其他指标。设置监控总是好的,但是使用上述方法之一修复潜在问题确实是更好的选择。
希望有帮助:)