为什么我的 Amazon Aurora 集群上的“已用卷字节数”始终在增加？

Question 1

这里有多件事在起作用……

每个表都存储在自己的表空间中

默认情况下，Aurora 集群（名为）的参数组default.aurora5.6定义innodb_file_per_table = ON。这意味着每个表都存储在 Aurora 存储集群上的单独文件中。您可以使用此查询查看每个表使用的表空间：

SELECT name, space FROM INFORMATION_SCHEMA.INNODB_SYS_TABLES;

注意：我还没有尝试过更改innodb_file_per_table为OFF。也许那会有帮助..？
删除表空间释放的存储空间不会被重新使用

引用 AWS 高级支持：

由于 Aurora 存储引擎的独特设计，为了提高其性能和容错能力，Aurora 不具备像标准 MySQL 那样对每个表的文件表空间进行碎片整理的功能。

不幸的是，目前 Aurora 无法像标准 MySQL 那样缩小表空间，并且所有碎片空间都会被收费，因为它包含在 VolumeBytesUsed 中。Aurora 无法
像标准 MySQL 那样回收已删除表的空间，原因是表数据的存储方式与具有单个存储卷的标准 MySQL 数据库完全不同。

由于设计复杂，如果您在 Aurora 中删除表或行，则不会在 Aurora 集群卷上回收空间。
无法回收少量存储空间是为了获得 Aurora 集群存储卷的额外性能提升和 Aurora 容错能力的极大提高而做出的牺牲。

但是有一些不太明显的方法可以重新利用那些浪费的空间...
再次引用 AWS 高级支持的话：

一旦您的总数据集超过一定大小（大约 160 GB），您就可以开始以 160 GB 的块形式回收空间以供重复使用，例如，如果您的 Aurora 集群卷中有 400 GB，并且删除了 160 GB 或更多的表，Aurora 就可以自动重新使用 160 GB 的数据。但是回收这些空间可能会很慢。
需要一次释放大量数据的原因是由于 Auroras 的独特设计，它是企业级数据库引擎，而标准 MySQL 不能在这种规模上使用。
优化表是邪恶的！

由于 Aurora 基于 MySQL 5.6，因此OPTIMIZE TABLE被映射到ALTER TABLE ... FORCE，这将重建表以更新索引统计信息并释放聚集索引中未使用的空间。实际上，与一起innodb_file_per_table = ON，这意味着运行OPTIMIZE TABLE会创建一个新的表空间文件并删除旧文件。由于删除表空间文件不会释放它正在使用的存储空间，这意味着OPTIMIZE TABLE将始终导致配置更多存储空间。哎哟！

参考：https://dev.mysql.com/doc/refman/5.6/en/optimize-table.html#optimize-table-innodb-details
使用临时表

默认情况下，Aurora 实例的参数组（名为default.aurora5.6）定义default_tmp_storage_engine = InnoDB。这意味着每次我创建TEMPORARY表时，它都会与我的所有常规的表，在 Aurora 存储集群上。这意味着需要配置新的空间来保存这些表，从而增加总 VolumeBytesUsed。
此问题的解决方案非常简单：将default_tmp_storage_engine参数值更改为。这将强制 Aurora在实例的本地存储上MyISAM创建表。值得注意的是：实例的本地存储是有限的；请查看CloudWatch 上的指标以了解您的实例有多少存储空间。更大（更昂贵）的实例拥有更多的本地存储空间。TEMPORARY
Free Local Storage

参考：尚无；当前的 Amazon Aurora 文档未提及此内容。我已要求 AWS 支持团队更新文档，如果他们更新了，我也会更新我的答案。

Answer

这里有多件事在起作用……

每个表都存储在自己的表空间中

默认情况下，Aurora 集群（名为）的参数组default.aurora5.6定义innodb_file_per_table = ON。这意味着每个表都存储在 Aurora 存储集群上的单独文件中。您可以使用此查询查看每个表使用的表空间：

SELECT name, space FROM INFORMATION_SCHEMA.INNODB_SYS_TABLES;

注意：我还没有尝试过更改innodb_file_per_table为OFF。也许那会有帮助..？
删除表空间释放的存储空间不会被重新使用

引用 AWS 高级支持：

由于 Aurora 存储引擎的独特设计，为了提高其性能和容错能力，Aurora 不具备像标准 MySQL 那样对每个表的文件表空间进行碎片整理的功能。

不幸的是，目前 Aurora 无法像标准 MySQL 那样缩小表空间，并且所有碎片空间都会被收费，因为它包含在 VolumeBytesUsed 中。Aurora 无法
像标准 MySQL 那样回收已删除表的空间，原因是表数据的存储方式与具有单个存储卷的标准 MySQL 数据库完全不同。

由于设计复杂，如果您在 Aurora 中删除表或行，则不会在 Aurora 集群卷上回收空间。
无法回收少量存储空间是为了获得 Aurora 集群存储卷的额外性能提升和 Aurora 容错能力的极大提高而做出的牺牲。

但是有一些不太明显的方法可以重新利用那些浪费的空间...
再次引用 AWS 高级支持的话：

一旦您的总数据集超过一定大小（大约 160 GB），您就可以开始以 160 GB 的块形式回收空间以供重复使用，例如，如果您的 Aurora 集群卷中有 400 GB，并且删除了 160 GB 或更多的表，Aurora 就可以自动重新使用 160 GB 的数据。但是回收这些空间可能会很慢。
需要一次释放大量数据的原因是由于 Auroras 的独特设计，它是企业级数据库引擎，而标准 MySQL 不能在这种规模上使用。
优化表是邪恶的！

由于 Aurora 基于 MySQL 5.6，因此OPTIMIZE TABLE被映射到ALTER TABLE ... FORCE，这将重建表以更新索引统计信息并释放聚集索引中未使用的空间。实际上，与一起innodb_file_per_table = ON，这意味着运行OPTIMIZE TABLE会创建一个新的表空间文件并删除旧文件。由于删除表空间文件不会释放它正在使用的存储空间，这意味着OPTIMIZE TABLE将始终导致配置更多存储空间。哎哟！

参考：https://dev.mysql.com/doc/refman/5.6/en/optimize-table.html#optimize-table-innodb-details
使用临时表

默认情况下，Aurora 实例的参数组（名为default.aurora5.6）定义default_tmp_storage_engine = InnoDB。这意味着每次我创建TEMPORARY表时，它都会与我的所有常规的表，在 Aurora 存储集群上。这意味着需要配置新的空间来保存这些表，从而增加总 VolumeBytesUsed。
此问题的解决方案非常简单：将default_tmp_storage_engine参数值更改为。这将强制 Aurora在实例的本地存储上MyISAM创建表。值得注意的是：实例的本地存储是有限的；请查看CloudWatch 上的指标以了解您的实例有多少存储空间。更大（更昂贵）的实例拥有更多的本地存储空间。TEMPORARY
Free Local Storage

参考：尚无；当前的 Amazon Aurora 文档未提及此内容。我已要求 AWS 支持团队更新文档，如果他们更新了，我也会更新我的答案。

Question 2

值得庆幸的是，这个问题不会持续太久。AWS 已宣布动态调整存储空间大小： https://aws.amazon.com/about-aws/whats-new/2020/10/amazon-aurora-enables-dynamic-resizing-database-storage-space/

Answer

值得庆幸的是，这个问题不会持续太久。AWS 已宣布动态调整存储空间大小： https://aws.amazon.com/about-aws/whats-new/2020/10/amazon-aurora-enables-dynamic-resizing-database-storage-space/

Question 3

当删除 Aurora 数据（例如删除表或分区）时，分配的总体空间保持不变。将来数据量增加时，将自动重新使用可用空间。 https://docs.amazonaws.cn/en_us/AmazonRDS/latest/AuroraUserGuide/Aurora.Managing.Performance.html

Answer

当删除 Aurora 数据（例如删除表或分区）时，分配的总体空间保持不变。将来数据量增加时，将自动重新使用可用空间。 https://docs.amazonaws.cn/en_us/AmazonRDS/latest/AuroraUserGuide/Aurora.Managing.Performance.html

为什么我的 Amazon Aurora 集群上的“已用卷字节数”始终在增加？

答案1

答案2

答案3

相关内容