RDS MySQL 实例的可用空间急剧下降,然后恢复

RDS MySQL 实例的可用空间急剧下降,然后恢复

在 3 分钟内,我们的 RDS 实例的可用空间从 50GB 降至仅剩 900MB,然后突然又回升至 50GB。这发生在上午 9 点左右,当时数据库活动并不多。我们的 CPU 使用率确实同时飙升至 60%。

RDS 免费存储

整个事情发生得太快了,当我们收到通知电子邮件并登录 AWS 控制台时,它就已经结束了。

进一步追溯,我们在 8 天前发生过类似的事件,但是可用磁盘空间并没有完全变为零 - 只变为了 11%,所以我们的警报甚至没有被触发。

我不知道是什么原因造成的。我问了同事,我们都没有进行任何手动查询。我们的写入密集型脚本都没有在早上运行(而且它们不会导致如此大的下降)。我检查了慢查询日志,虽然里面有很多,但没有什么不正常的。错误日志只包含我们遇到的 1 个错误。即使报告的正常运行时间为 64 天,所以我们知道 MySQL 本身没有重新启动。

你们还有什么建议我可以在哪里诊断这个问题并找出发生了什么吗?

相关内容