top 命令的 wa（等待 I/O）很大

Question 1

以下是一些查找磁盘活动的工具：

您ps auxf还将看到哪些进程处于不间断磁盘睡眠状态（D），因为它们正在等待 I/O。

有时候，访问量会增加到 40，但访问者数量并没有增加。

您可能还想创建备份，看看硬盘是否正在慢慢出现故障。硬盘通常在损坏之前就开始变慢。这也可以解释高负载的原因。

Answer

以下是一些查找磁盘活动的工具：

您ps auxf还将看到哪些进程处于不间断磁盘睡眠状态（D），因为它们正在等待 I/O。

有时候，访问量会增加到 40，但访问者数量并没有增加。

您可能还想创建备份，看看硬盘是否正在慢慢出现故障。硬盘通常在损坏之前就开始变慢。这也可以解释高负载的原因。

Question 2

顶部的输出表明 DBMS 正在经历大多数 I/O 等待，因此数据库调整问题显然是需要调查的。

数据库服务器上的 I/O 等待（尤其是在负载高峰时）表明您的 DBMS 可能受磁盘限制（即您需要更快的磁盘子系统）或可能存在调优问题。您可能还应该研究数据库服务器的配置 - 即跟踪它正在做什么以及哪些查询占用了时间。

诊断数据库调整问题的一些起点：

找到耗时最多的查询，并查看查询计划。查看是否有奇怪的查询计划，例如不应该出现的表扫描。也许数据库需要添加索引。
较长的资源等待时间可能意味着某些关键资源池需要扩展。
较长的 I/O 等待时间可能意味着您需要更快的磁盘子系统。
您的日志和数据卷是否位于不同的驱动器上？数据库日志有很多小的连续写入（本质上它们的行为类似于环形缓冲区）。如果您有一个繁忙的随机访问工作负载与您的日志共享同一个磁盘，这将严重影响日志的吞吐量。要提交数据库事务，必须将日志条目写入磁盘，因此这会对整个系统造成瓶颈。

请注意，某些 MySQL 存储引擎不使用日志，因此这对您来说可能不是问题。

脚注：排队系统

排队系统（吞吐量的统计模型）在系统接近饱和时会以双曲线方式变慢。对于高水平近似，饱和度为 50% 的系统的平均队列长度为 2。饱和度为 90% 的系统队列长度为 10，饱和度为 99% 的系统队列长度为 100。

因此，在接近饱和的系统中，负载的微小变化可能会导致等待时间发生很大变化，在这种情况下表现为等待 I/O 的时间。如果磁盘子系统的 I/O 容量接近饱和，则负载的微小变化可能会导致响应时间发生重大变化。

Answer

顶部的输出表明 DBMS 正在经历大多数 I/O 等待，因此数据库调整问题显然是需要调查的。

数据库服务器上的 I/O 等待（尤其是在负载高峰时）表明您的 DBMS 可能受磁盘限制（即您需要更快的磁盘子系统）或可能存在调优问题。您可能还应该研究数据库服务器的配置 - 即跟踪它正在做什么以及哪些查询占用了时间。

诊断数据库调整问题的一些起点：

找到耗时最多的查询，并查看查询计划。查看是否有奇怪的查询计划，例如不应该出现的表扫描。也许数据库需要添加索引。
较长的资源等待时间可能意味着某些关键资源池需要扩展。
较长的 I/O 等待时间可能意味着您需要更快的磁盘子系统。
您的日志和数据卷是否位于不同的驱动器上？数据库日志有很多小的连续写入（本质上它们的行为类似于环形缓冲区）。如果您有一个繁忙的随机访问工作负载与您的日志共享同一个磁盘，这将严重影响日志的吞吐量。要提交数据库事务，必须将日志条目写入磁盘，因此这会对整个系统造成瓶颈。

请注意，某些 MySQL 存储引擎不使用日志，因此这对您来说可能不是问题。

脚注：排队系统

排队系统（吞吐量的统计模型）在系统接近饱和时会以双曲线方式变慢。对于高水平近似，饱和度为 50% 的系统的平均队列长度为 2。饱和度为 90% 的系统队列长度为 10，饱和度为 99% 的系统队列长度为 100。

因此，在接近饱和的系统中，负载的微小变化可能会导致等待时间发生很大变化，在这种情况下表现为等待 I/O 的时间。如果磁盘子系统的 I/O 容量接近饱和，则负载的微小变化可能会导致响应时间发生重大变化。

Question 3

运行iotop或atop -dD，查看哪些进程正在执行 io。strace如果您需要仔细查看，请使用。

Answer

运行iotop或atop -dD，查看哪些进程正在执行 io。strace如果您需要仔细查看，请使用。

Question 4

有时候，访问量会增加到 40，但访问者数量并没有增加。

用户正在做什么可能与实际用户数量一样重要。搜索论坛等操作将比加载和查看单个主题或主题列表更加费力。

另外：您是在专用服务器还是 VPS 上运行？如果您的服务不在专用服务器上，那么在同一主机上运行的应用程序的操作将产生影响，因为与您的 VM 共享主机的 VM 将争夺 I/O 资源的份额。

正如其他人指出的那样，像这样的工具iotop将帮助您更深入地了解哪些任务正在等待 I/O 响应以及它们当时正在访问哪些文件。

Answer

有时候，访问量会增加到 40，但访问者数量并没有增加。

用户正在做什么可能与实际用户数量一样重要。搜索论坛等操作将比加载和查看单个主题或主题列表更加费力。

另外：您是在专用服务器还是 VPS 上运行？如果您的服务不在专用服务器上，那么在同一主机上运行的应用程序的操作将产生影响，因为与您的 VM 共享主机的 VM 将争夺 I/O 资源的份额。

正如其他人指出的那样，像这样的工具iotop将帮助您更深入地了解哪些任务正在等待 I/O 响应以及它们当时正在访问哪些文件。

相关内容