某些 SQL 查询在 ESXI 托管环境中的性能非常差

Question 1

总结：

在你的真实服务器上，你可以在不到一秒的时间内进行 1700 次表更新 + 1700 次提交，
在你的虚拟服务器上，你可以在 9 秒内进行 1700 次表更新 + 1700 次提交，
在您的虚拟服务器上，您可以在不到一秒的时间内完成 1700 次表更新 + 1 次提交。

因此在我看来，您的问题可以重新定义为“在真实服务器上，我可以在不到一秒的时间内完成 1700 次提交，但在我的虚拟服务器上性能却下降了十倍”。

1700 次表更新和 1700 次提交之间有什么区别？表更新完全缓存，完全不依赖于磁盘 I/O。提交则完全不同。根据事务数据库的本质，数据库引擎必须非常确定犯罪已实际保存到磁盘（保存到日志文件），然后才开始提交下一个事务。因此，对于这 1700 次提交中的每一次，它都必须等待整个 I/O 往返。总而言之，在您的场景中，I/O 的延迟起着非常重要的作用，应该进行分析（不要将延迟与 I/O 速率或字节吞吐量混淆；这三个都是完全不同的动物；它们总是单独调整的）。

使用 IOMeter 测试存储是个不错的计划。它在启动时会挂起，因为它试图用测试文件填满整个磁盘。只需等到文件增长到相当大的数量并重新启动 IOMeter，它就可以正常处理“不完整”的测试文件。

Answer

总结：

在你的真实服务器上，你可以在不到一秒的时间内进行 1700 次表更新 + 1700 次提交，
在你的虚拟服务器上，你可以在 9 秒内进行 1700 次表更新 + 1700 次提交，
在您的虚拟服务器上，您可以在不到一秒的时间内完成 1700 次表更新 + 1 次提交。

因此在我看来，您的问题可以重新定义为“在真实服务器上，我可以在不到一秒的时间内完成 1700 次提交，但在我的虚拟服务器上性能却下降了十倍”。

1700 次表更新和 1700 次提交之间有什么区别？表更新完全缓存，完全不依赖于磁盘 I/O。提交则完全不同。根据事务数据库的本质，数据库引擎必须非常确定犯罪已实际保存到磁盘（保存到日志文件），然后才开始提交下一个事务。因此，对于这 1700 次提交中的每一次，它都必须等待整个 I/O 往返。总而言之，在您的场景中，I/O 的延迟起着非常重要的作用，应该进行分析（不要将延迟与 I/O 速率或字节吞吐量混淆；这三个都是完全不同的动物；它们总是单独调整的）。

使用 IOMeter 测试存储是个不错的计划。它在启动时会挂起，因为它试图用测试文件填满整个磁盘。只需等到文件增长到相当大的数量并重新启动 IOMeter，它就可以正常处理“不完整”的测试文件。

Question 2

您的澄清使这个问题有所明了。

3 驱动器 SATA RAID 5 组不是写入性能的最佳磁盘配置。每次写入 IO 都会产生 [最多] 4 个磁盘 IO（读取当前块、读取当前奇偶校验、写入新块、写入新奇偶校验）。实际上，这会将您的三个 7200 rpm 磁盘变成一个性能更像单个 5400rpm 驱动器的磁盘（假设您的基本驱动器为 7200 rpm）。

其次，您说 SQL VM 上有许多活动快照。VMware ESXi 快照会产生不小的开销 - 根据您正在执行的操作，当您有活动快照时，IO 开销将达到 50-100%。这会影响读取和写入。

第三，您说您正在使用精简配置 - 这会对 IO 性能产生影响，但不如其他两个影响那么显著。

最后，您没有说 ESXi 主机上是否有任何其他虚拟机在运行 - 如果有，它们显然会影响整体性能，尤其是在使用 RAID5 x 1TB SATA 磁盘设置的情况下。

Answer

您的澄清使这个问题有所明了。

3 驱动器 SATA RAID 5 组不是写入性能的最佳磁盘配置。每次写入 IO 都会产生 [最多] 4 个磁盘 IO（读取当前块、读取当前奇偶校验、写入新块、写入新奇偶校验）。实际上，这会将您的三个 7200 rpm 磁盘变成一个性能更像单个 5400rpm 驱动器的磁盘（假设您的基本驱动器为 7200 rpm）。

其次，您说 SQL VM 上有许多活动快照。VMware ESXi 快照会产生不小的开销 - 根据您正在执行的操作，当您有活动快照时，IO 开销将达到 50-100%。这会影响读取和写入。

第三，您说您正在使用精简配置 - 这会对 IO 性能产生影响，但不如其他两个影响那么显著。

最后，您没有说 ESXi 主机上是否有任何其他虚拟机在运行 - 如果有，它们显然会影响整体性能，尤其是在使用 RAID5 x 1TB SATA 磁盘设置的情况下。

Question 3

我认为您的测试并不是那么可靠，无法确定虚拟化系统是否存在问题。一秒钟的测试不足以给系统施加压力以显示任何真正的瓶颈。

在虚拟化世界和 SQL Server 中，有许多活动部件。我认为磁盘 IO 是这里的主要参与者，但 RAM 也是。ESX 可以根据需要从客户机提供和获取 RAM，有时 ESX 需要几秒钟才能做出反应，从而产生短暂的暂停。如果服务器处于一定的恒定负载下，则 ESX 会稳定 RAM，但如果测试时间短且突发，则可能需要一些时间来加速。

在开始将一切推倒之前，请先运行更长时间的测试，并使用 ESX 监控 RAM 使用情况、磁盘 IO 延迟、CPU 队列长度等。一个好的测试需要在物理机上运行 30 到 60 秒，我希望虚拟机的时间在该时间的 150% 以内。

Answer

我认为您的测试并不是那么可靠，无法确定虚拟化系统是否存在问题。一秒钟的测试不足以给系统施加压力以显示任何真正的瓶颈。

在虚拟化世界和 SQL Server 中，有许多活动部件。我认为磁盘 IO 是这里的主要参与者，但 RAM 也是。ESX 可以根据需要从客户机提供和获取 RAM，有时 ESX 需要几秒钟才能做出反应，从而产生短暂的暂停。如果服务器处于一定的恒定负载下，则 ESX 会稳定 RAM，但如果测试时间短且突发，则可能需要一些时间来加速。

在开始将一切推倒之前，请先运行更长时间的测试，并使用 ESX 监控 RAM 使用情况、磁盘 IO 延迟、CPU 队列长度等。一个好的测试需要在物理机上运行 30 到 60 秒，我希望虚拟机的时间在该时间的 150% 以内。

某些 SQL 查询在 ESXI 托管环境中的性能非常差

测试用例 #1

测试用例 #2

测试用例 #3

测试用例 #4

答案1

答案2

答案3

相关内容