为什么我的服务器 CPU 使用率只有 1.5%，但负载却很高

Question 1

iotop是一个非常好的工具，可以了解你的机器的 IO 使用情况以及所有进程在做什么。

在 rhel/centos 版本中安装

 # yum install iotop -y

对于像 Ubuntu 这样的版本：

 # apt-get install iotop

Answer

iotop是一个非常好的工具，可以了解你的机器的 IO 使用情况以及所有进程在做什么。

在 rhel/centos 版本中安装

 # yum install iotop -y

对于像 Ubuntu 这样的版本：

 # apt-get install iotop

Question 2

你应该绝不使用 apachectl 测量系统的性能。这是从 apache 的角度来看的，对于操作系统其余部分的性能而言，这可能完全是错误的。

iostat 是 sysstat 包的一部分，可以测量 io 性能。如果你想找出哪个特定进程正在占用 io，你也可以使用 iotop（可通过 EPEL 存储库获得 - 不过，我猜它会显示“apache”）。从 iostat 中，你希望它尽可能低，util%这反过来会给你一个非常低的await值。

您的 mpstat 似乎不太好。再次，您显示了较高的 IO 使用率 ( %iowait)。对于一般的网站，您希望 iowaits 低于 1% 才能响应良好。对于典型的 Apache 环境，您还使用了相当高的基于系统的使用率。但目前没有足够的数据来找出原因。

虽然不是所要求的一部分，但您应该熟悉使用它top作为系统的最基本诊断工具，因为它将让您全面了解系统的各个方面。顶部输出中最重要的部分实际上位于输出的顶部（讽刺的是，您在 pastebin 中遗漏了它）。

最后，如果您指的是 apache 的“最大服务器”设置中的 maxclients，那么 3000 对世界上任何系统来说都太高了。我认为即使是那些价值 50 万美元的系统也无法处理那么多 apache 进程。如果 apach 出于某种原因决定增加服务器数量，那么您将陷入真正的困境。然而，理想的数字只能通过在特定机器下测试特定应用程序来测量。基本上，您的最大服务器 * 每个服务器使用的内存量应该等于您的总可用内存（不包括交换空间，因为您不想一直使用交换空间，也包括 apache 的总可用内存，即操作系统、其他服务等之后）。

Answer

你应该绝不使用 apachectl 测量系统的性能。这是从 apache 的角度来看的，对于操作系统其余部分的性能而言，这可能完全是错误的。

iostat 是 sysstat 包的一部分，可以测量 io 性能。如果你想找出哪个特定进程正在占用 io，你也可以使用 iotop（可通过 EPEL 存储库获得 - 不过，我猜它会显示“apache”）。从 iostat 中，你希望它尽可能低，util%这反过来会给你一个非常低的await值。

您的 mpstat 似乎不太好。再次，您显示了较高的 IO 使用率 ( %iowait)。对于一般的网站，您希望 iowaits 低于 1% 才能响应良好。对于典型的 Apache 环境，您还使用了相当高的基于系统的使用率。但目前没有足够的数据来找出原因。

虽然不是所要求的一部分，但您应该熟悉使用它top作为系统的最基本诊断工具，因为它将让您全面了解系统的各个方面。顶部输出中最重要的部分实际上位于输出的顶部（讽刺的是，您在 pastebin 中遗漏了它）。

最后，如果您指的是 apache 的“最大服务器”设置中的 maxclients，那么 3000 对世界上任何系统来说都太高了。我认为即使是那些价值 50 万美元的系统也无法处理那么多 apache 进程。如果 apach 出于某种原因决定增加服务器数量，那么您将陷入真正的困境。然而，理想的数字只能通过在特定机器下测试特定应用程序来测量。基本上，您的最大服务器 * 每个服务器使用的内存量应该等于您的总可用内存（不包括交换空间，因为您不想一直使用交换空间，也包括 apache 的总可用内存，即操作系统、其他服务等之后）。

Question 3

当前正在处理 110 个请求，0 个闲置工人

...

我已将 whm 中的最大连接数和最大服务器数分别增加到 1500 和 3000

正如 Peter 所说，这里有相当多的 IO 正在进行 - 但我认为这不是唯一的问题。为什么您的服务器没有很多空闲的工作器？16 个核心？这是一个糟糕的设置。使用大型机器进行网络服务是没有意义的。将 serverlimit 设置为比 maxclients 高得多没有多大意义。看起来有什么东西限制了 apache 线程的数量 - 我们需要从 httpd.conf 查看您的核心设置

我怀疑 irqbalancing 不是最佳的。看起来应用程序工作负载分布均匀。

为什么我的服务器 CPU 使用率只有 1.5%，但负载却很高

但您没有提供任何负载指标。

正如彼得所说，你应该从顶部开始。

该服务器还会对其他站点进行大量 curl 并缓存结果......服务器响应非常快，但有一点延迟。

那么延迟是由于远程访问造成的吗？还是其他原因？

你说这里存在问题 - 但如果不知道你要解决的问题是什么，就很难给出任何建议。当然，有很多写入操作正在进行，数据模式表明有很多非常小的数据块（同样，你的 HTTP 流量看起来很奇怪），但如果不了解这里发生了什么，就不可能给出建议。

Answer

当前正在处理 110 个请求，0 个闲置工人

...

我已将 whm 中的最大连接数和最大服务器数分别增加到 1500 和 3000

正如 Peter 所说，这里有相当多的 IO 正在进行 - 但我认为这不是唯一的问题。为什么您的服务器没有很多空闲的工作器？16 个核心？这是一个糟糕的设置。使用大型机器进行网络服务是没有意义的。将 serverlimit 设置为比 maxclients 高得多没有多大意义。看起来有什么东西限制了 apache 线程的数量 - 我们需要从 httpd.conf 查看您的核心设置

我怀疑 irqbalancing 不是最佳的。看起来应用程序工作负载分布均匀。

为什么我的服务器 CPU 使用率只有 1.5%，但负载却很高

但您没有提供任何负载指标。

正如彼得所说，你应该从顶部开始。

该服务器还会对其他站点进行大量 curl 并缓存结果......服务器响应非常快，但有一点延迟。

那么延迟是由于远程访问造成的吗？还是其他原因？

你说这里存在问题 - 但如果不知道你要解决的问题是什么，就很难给出任何建议。当然，有很多写入操作正在进行，数据模式表明有很多非常小的数据块（同样，你的 HTTP 流量看起来很奇怪），但如果不了解这里发生了什么，就不可能给出建议。

Question 4

我在 cpanel 上提交了一张票。

那里的能干人员告诉我，问题在于 kjournald 每次写入 5-10MB 的文件。

我不太清楚为什么写了这么多。

我转移到了 SSD，而且它还能正常工作。

基本上我需要运行iostat -o -a并查看 kjournald 是否是罪魁祸首。

它导致太多的 IO 写入，从而导致磁盘利用率始终为 100%。

Answer

我在 cpanel 上提交了一张票。

那里的能干人员告诉我，问题在于 kjournald 每次写入 5-10MB 的文件。

我不太清楚为什么写了这么多。

我转移到了 SSD，而且它还能正常工作。

基本上我需要运行iostat -o -a并查看 kjournald 是否是罪魁祸首。

它导致太多的 IO 写入，从而导致磁盘利用率始终为 100%。

为什么我的服务器 CPU 使用率只有 1.5%，但负载却很高

答案1

答案2

答案3

答案4

相关内容