具有 EBS 卷的 Amazon EC2 MySQL 实例上的高 iowait

Question 1

如果您发布 my.cnf，并说明您使用的是 InnoDB 还是 MyISAM 表，以及您的工作负载是读取密集型还是写入密集型，这将很有帮助。否则，我们只是在猜测。以下是我的猜测：

首先，我会查看并确保你的查询已正确编入索引。MySQL 数据库的高 I/O 要么是由极高的并发性、服务器调优不佳造成的，要么是由必须进行全表或索引扫描的查询性能不佳造成的。有关如何查找性能不佳的查询的一些提示，可在我的在 Ideeli 的技术博客上发表文章。

检查您的 my.cnf。如果您使用的是 InnoDB，请确保 innodb_buffer_pool_size 和 innodb_log_file_size 足够大。由于 EBS 具有如此多的可变延迟，因此最大化 innodb_log_file_size 可以带来显着的性能优势。如果您使用的是 MyISAM（您不应该使用），请确保您的 key_buffer 大小足够大。

如果您确信您的查询已得到很好的优化，并且您的服务器已得到很好的调整，我们可以继续讨论下一个项目。ext3 对于数据库来说并不理想。其中一个主要原因是 ext3 一次只允许一个线程更新一个 inode（尝试查找相关文档）。如果您没有使用 innodb-file-per-table 运行，则意味着 ibdata 文件上存在大量文件系统争用。xfs 没有此限制，并且已被证明在数据库工作负载方面表现更好（需要源代码）。

如果您无法更改为 xfs，请确保您正在使用 innodb-file-per-table，并且至少确保您在挂载上有 noatime 和 nodiratime。

接下来，讨论您的实例大小。除非数据集很小，否则 c1.medium 不是大多数数据库的理想实例大小。MySQL 通常更看重内存而不是计算能力。c1.medium 只有 1.7GB 的 RAM！您的数据集有多大？一般来说，m1.large（具有 7.5GB RAM）的性能优于 c1.medium，除非在极少数情况下。它的价格也是 c1.large 的两倍，为 0.34 美元/小时。

现在讨论 EBS 卷的 RAID。是的，RAID 将大大提高您的 IOPS。（增加实例大小也是如此）。 不要使用 RAID0...至少如果你关心你的数据。我已经在很多地方解释过这一点，包括我的博客，作为演讲者2011 年 Percona Live 纽约站，和这里是 serverfault简而言之，EBS 卷会以非典型方式发生故障，并且能够从集合中删除卷已被证明在很多情况下都是有价值的，最明显的是在 2011 年的 EBS 大中断期间，当时一些站点离线了好几天...尽管有数十个实例受到 EBS 问题的影响，但我们在凌晨 4 点离线了 45 分钟。

以下是一些基准对于使用 MySQL 的 RAIDed EBS 卷。

最后，Percona 服务器拥有大量的可扩展性优化。这是一份白皮书关于我公司从 MySQL 切换到 Percona Server 的经历。我们每天都会遇到数据库停滞和中断的情况。由于进行了多项可扩展性改进，只需从 MySQL 切换到 Percona Server，就可以在一夜之间解决该问题。

因此，总而言之...

调整查询
调整你的服务器
让自己拥有更好的“硬件”
使用 xfs，而不是 ext3
RAID10，而不是 RAID0
从 MySQL 切换到 Percona Server

至于 MySQL Cluster，它与 MySQL 完全不同，通常不适合大多数 OLTP 应用程序。加莱拉/Percona XtraDB集群也是新的和有趣的集群产品。你有很多但是，在开始之前，您需要考虑多种选择。我们在 EC2 中使用 RAID10 的单个 m2.4xlarge 提供 24k qps 的峰值服务。

祝你好运！

Answer

如果您发布 my.cnf，并说明您使用的是 InnoDB 还是 MyISAM 表，以及您的工作负载是读取密集型还是写入密集型，这将很有帮助。否则，我们只是在猜测。以下是我的猜测：

首先，我会查看并确保你的查询已正确编入索引。MySQL 数据库的高 I/O 要么是由极高的并发性、服务器调优不佳造成的，要么是由必须进行全表或索引扫描的查询性能不佳造成的。有关如何查找性能不佳的查询的一些提示，可在我的在 Ideeli 的技术博客上发表文章。

检查您的 my.cnf。如果您使用的是 InnoDB，请确保 innodb_buffer_pool_size 和 innodb_log_file_size 足够大。由于 EBS 具有如此多的可变延迟，因此最大化 innodb_log_file_size 可以带来显着的性能优势。如果您使用的是 MyISAM（您不应该使用），请确保您的 key_buffer 大小足够大。

如果您确信您的查询已得到很好的优化，并且您的服务器已得到很好的调整，我们可以继续讨论下一个项目。ext3 对于数据库来说并不理想。其中一个主要原因是 ext3 一次只允许一个线程更新一个 inode（尝试查找相关文档）。如果您没有使用 innodb-file-per-table 运行，则意味着 ibdata 文件上存在大量文件系统争用。xfs 没有此限制，并且已被证明在数据库工作负载方面表现更好（需要源代码）。

如果您无法更改为 xfs，请确保您正在使用 innodb-file-per-table，并且至少确保您在挂载上有 noatime 和 nodiratime。

接下来，讨论您的实例大小。除非数据集很小，否则 c1.medium 不是大多数数据库的理想实例大小。MySQL 通常更看重内存而不是计算能力。c1.medium 只有 1.7GB 的 RAM！您的数据集有多大？一般来说，m1.large（具有 7.5GB RAM）的性能优于 c1.medium，除非在极少数情况下。它的价格也是 c1.large 的两倍，为 0.34 美元/小时。

现在讨论 EBS 卷的 RAID。是的，RAID 将大大提高您的 IOPS。（增加实例大小也是如此）。 不要使用 RAID0...至少如果你关心你的数据。我已经在很多地方解释过这一点，包括我的博客，作为演讲者2011 年 Percona Live 纽约站，和这里是 serverfault简而言之，EBS 卷会以非典型方式发生故障，并且能够从集合中删除卷已被证明在很多情况下都是有价值的，最明显的是在 2011 年的 EBS 大中断期间，当时一些站点离线了好几天...尽管有数十个实例受到 EBS 问题的影响，但我们在凌晨 4 点离线了 45 分钟。

以下是一些基准对于使用 MySQL 的 RAIDed EBS 卷。

最后，Percona 服务器拥有大量的可扩展性优化。这是一份白皮书关于我公司从 MySQL 切换到 Percona Server 的经历。我们每天都会遇到数据库停滞和中断的情况。由于进行了多项可扩展性改进，只需从 MySQL 切换到 Percona Server，就可以在一夜之间解决该问题。

因此，总而言之...

调整查询
调整你的服务器
让自己拥有更好的“硬件”
使用 xfs，而不是 ext3
RAID10，而不是 RAID0
从 MySQL 切换到 Percona Server

至于 MySQL Cluster，它与 MySQL 完全不同，通常不适合大多数 OLTP 应用程序。加莱拉/Percona XtraDB集群也是新的和有趣的集群产品。你有很多但是，在开始之前，您需要考虑多种选择。我们在 EC2 中使用 RAID10 的单个 m2.4xlarge 提供 24k qps 的峰值服务。

祝你好运！

Question 2

这是很多公司都遇到的问题，各种在线论坛上对该问题的解决方案进行了相当充分的讨论。

通常，为了增加潜在的 iops，会将两个或多个 EBS 卷合并成一个 RAID0 阵列。但这并非没有风险。如您所知，使用 RAID0，只要其中一个成员 EBS 卷出现问题，您的数据就会被毁掉。因此，您可以考虑使用更具弹性的 RAID 级别，比如 RAID 10。

Answer

这是很多公司都遇到的问题，各种在线论坛上对该问题的解决方案进行了相当充分的讨论。

通常，为了增加潜在的 iops，会将两个或多个 EBS 卷合并成一个 RAID0 阵列。但这并非没有风险。如您所知，使用 RAID0，只要其中一个成员 EBS 卷出现问题，您的数据就会被毁掉。因此，您可以考虑使用更具弹性的 RAID 级别，比如 RAID 10。

Question 3

由于 500gps 对 SQL 服务器来说是一个相当温和的负载，我建议查看磁盘上创建的临时表的百分比，并开始优化查询和 MySQL 服务器设置。

1、不要采用Raid0的方法，它最终会失败，你会后悔的。

2、不，当每秒查询数如此低时，您不需要 MySQL Cluster。

3、是的，它确实会影响应用程序的性能，您可以启用慢速日志来测量它的性能，然后亲自查看一下。

mysql 目前使用了多少内存，还有剩余空间吗？
如果没有，您应该考虑切换到更大的实例，并开始使用 sundry 的 mysql 调整脚本优化设置：
http://www.day32.com/MySQL/tuning-primer.sh

Answer

由于 500gps 对 SQL 服务器来说是一个相当温和的负载，我建议查看磁盘上创建的临时表的百分比，并开始优化查询和 MySQL 服务器设置。

1、不要采用Raid0的方法，它最终会失败，你会后悔的。

2、不，当每秒查询数如此低时，您不需要 MySQL Cluster。

3、是的，它确实会影响应用程序的性能，您可以启用慢速日志来测量它的性能，然后亲自查看一下。

mysql 目前使用了多少内存，还有剩余空间吗？
如果没有，您应该考虑切换到更大的实例，并开始使用 sundry 的 mysql 调整脚本优化设置：
http://www.day32.com/MySQL/tuning-primer.sh

Question 4

3- 您认为这种情况会严重影响我们的应用程序吗？如果我们转向 RAID 0 和/或集群解决方案，它们的性能会好得多吗？

由于您正在运行 SQL 服务器，因此查看 SQL 服务器指标比了解查询是否快速响应更有意义。从您的个位数平均请求等待时间 (await) 来看，我认为 I/O 还不是问题。

此外，由于您主要看到的是读取负载，因此您可以通过使用更大的缓存/增加 RAM 量并调整 MySQL 实例的缓存参数来减少它。我预计这会比更改存储以处理更多 I/O 产生更大的性能影响。

Answer

3- 您认为这种情况会严重影响我们的应用程序吗？如果我们转向 RAID 0 和/或集群解决方案，它们的性能会好得多吗？

由于您正在运行 SQL 服务器，因此查看 SQL 服务器指标比了解查询是否快速响应更有意义。从您的个位数平均请求等待时间 (await) 来看，我认为 I/O 还不是问题。

此外，由于您主要看到的是读取负载，因此您可以通过使用更大的缓存/增加 RAM 量并调整 MySQL 实例的缓存参数来减少它。我预计这会比更改存储以处理更多 I/O 产生更大的性能影响。

具有 EBS 卷的 Amazon EC2 MySQL 实例上的高 iowait

答案1

答案2

答案3

答案4

相关内容