服务器负载每天都会激增几次，过去一个月的平均负载是全年平均负载的 5 倍

Question 1

实际上，Loadavg 并不能告诉您太多有关系统是否性能不佳的信息；它是一种非常通用的指标，用于描述系统的繁忙程度，其中繁忙定义为当前正在执行或等待执行 CPU 指令的进程数的索引。在八核系统上，工作负载由大量短命进程（例如 Web 服务器）描述，loadavg 超过 50 甚至可能不会引起我的注意。

您能否将这些峰值与您的 apache 日志关联起来，以查看在峰值期间响应时间是否受到影响？您是否只是在峰值期间处理更多请求？您是否保存了 iowait 和用户与系统 cpu 等统计数据，它们是否相关？另一位提到交换的发帖人是正确的：交换会导致进程堆积，因为内存访问速度减慢到磁盘速度，这会导致更高的 loadavg，因为进程会挂起。

这些都是需要调查的事情；更多数据和历史保存的数据可以帮助您解决这个问题。希望这能有所帮助；祝你好运！

Answer

实际上，Loadavg 并不能告诉您太多有关系统是否性能不佳的信息；它是一种非常通用的指标，用于描述系统的繁忙程度，其中繁忙定义为当前正在执行或等待执行 CPU 指令的进程数的索引。在八核系统上，工作负载由大量短命进程（例如 Web 服务器）描述，loadavg 超过 50 甚至可能不会引起我的注意。

您能否将这些峰值与您的 apache 日志关联起来，以查看在峰值期间响应时间是否受到影响？您是否只是在峰值期间处理更多请求？您是否保存了 iowait 和用户与系统 cpu 等统计数据，它们是否相关？另一位提到交换的发帖人是正确的：交换会导致进程堆积，因为内存访问速度减慢到磁盘速度，这会导致更高的 loadavg，因为进程会挂起。

这些都是需要调查的事情；更多数据和历史保存的数据可以帮助您解决这个问题。希望这能有所帮助；祝你好运！

Question 2

据新上任的系统管理员称，负载之所以这么高，是因为我们最近一直在不断达到带宽分配的容量（不确定是入站还是出站）。这个问题的一些回答者说得对，这根本不是服务器故障的迹象。这是一个网络问题，新请求必须等待带宽清除后才能继续 - 因此，负载（延迟）很高。无论如何，我们最近搬到了一个带宽分配更大的新数据中心。谢谢大家！

Answer

据新上任的系统管理员称，负载之所以这么高，是因为我们最近一直在不断达到带宽分配的容量（不确定是入站还是出站）。这个问题的一些回答者说得对，这根本不是服务器故障的迹象。这是一个网络问题，新请求必须等待带宽清除后才能继续 - 因此，负载（延迟）很高。无论如何，我们最近搬到了一个带宽分配更大的新数据中心。谢谢大家！

Question 3

您在后端使用 Memcached 之类的东西吗？TTL 会在那个时间范围内过期吗？

当负载超过 100% 时，性能是否真的会受到影响？在多核 CPU 中，这很可能是正常的。

PS，看起来你正在动用你的 SWAP 分配；我会看一下。

Answer

您在后端使用 Memcached 之类的东西吗？TTL 会在那个时间范围内过期吗？

当负载超过 100% 时，性能是否真的会受到影响？在多核 CPU 中，这很可能是正常的。

PS，看起来你正在动用你的 SWAP 分配；我会看一下。

Question 4

如果您的 Apache 应用程序针对数据库后端运行，则很有可能在数据库端遇到锁定/争用问题。您频繁生成（或重复使用）的 Apache 进程会发现自己正在等待长时间运行的数据库请求完成，因此累积到一个很大的数字。

因此，请检查您的数据库服务器是否能反映负载情况。如果您碰巧使用 MySQL（LAMP 中的 M 是吗？），则应考虑使用mysql-snmp以获得更详细的报告。

Answer

如果您的 Apache 应用程序针对数据库后端运行，则很有可能在数据库端遇到锁定/争用问题。您频繁生成（或重复使用）的 Apache 进程会发现自己正在等待长时间运行的数据库请求完成，因此累积到一个很大的数字。

因此，请检查您的数据库服务器是否能反映负载情况。如果您碰巧使用 MySQL（LAMP 中的 M 是吗？），则应考虑使用mysql-snmp以获得更详细的报告。

服务器负载每天都会激增几次，过去一个月的平均负载是全年平均负载的 5 倍

答案1

答案2

答案3

答案4

相关内容