在这种情况下，平均负载是如何计算的？

Question 1

你的问题：这种情况下平均负载是如何计算的？

回答：这三位数字是不同时间序列（1、5 和 15 分钟）的指数阻尼移动平均值。此计算基于放置在处理器队列中的进程，而不是基于实际 CPU 利用率，而实际 CPU 利用率都习惯于以百分比形式查看（例如在 Windows 中）

但我认为这不是您想要了解当前系统中发生的情况的答案。

平均负载反映了“系统”负载，考虑了 CPU 负载和 I/O 等待。这是最常见的参数，您需要从该参数开始排除性能问题。使用不同的指标（磁盘负载）和工具（例如 sysstat 软件包中的 iostat）来分析系统性能。

还有第二个答案对你的问题：

计算CPU利用率使用

grep 'cpu ' /proc/stat | awk '{usage=100-($5*100)/($2+$3+$4+$5+$6+$7+$8)} END {print usage}'

看话题并阅读文章。

我强烈建议使用监控系统（例如 Zabbix）

Answer

你的问题：这种情况下平均负载是如何计算的？

回答：这三位数字是不同时间序列（1、5 和 15 分钟）的指数阻尼移动平均值。此计算基于放置在处理器队列中的进程，而不是基于实际 CPU 利用率，而实际 CPU 利用率都习惯于以百分比形式查看（例如在 Windows 中）

但我认为这不是您想要了解当前系统中发生的情况的答案。

平均负载反映了“系统”负载，考虑了 CPU 负载和 I/O 等待。这是最常见的参数，您需要从该参数开始排除性能问题。使用不同的指标（磁盘负载）和工具（例如 sysstat 软件包中的 iostat）来分析系统性能。

还有第二个答案对你的问题：

计算CPU利用率使用

grep 'cpu ' /proc/stat | awk '{usage=100-($5*100)/($2+$3+$4+$5+$6+$7+$8)} END {print usage}'

看话题并阅读文章。

我强烈建议使用监控系统（例如 Zabbix）

Question 2

这3个数字是不是不同 CPU 的编号。

这些数字是平均值^{（看注释）}最后 1 分钟、5 分钟和 15 分钟。

负载的含义如下：如果单 CPU 系统上有多个进程，它们看起来是并行运行的。但事实并非如此。实际发生的情况是：内核为进程提供 1/100 秒，然后通过中断中断其运行。然后将接下来的 1/100 秒交给另一个进程。有时这个1/100可以是1/1000甚至是不断变化的时间限制，这并不重要。

实际上，“哪个进程应该获得下一个 1/100 秒间隔？”这个问题将由复杂的启发式方法决定。它被称为任务调度。

当然，被阻塞的进程，例如正在等待从磁盘读取数据的进程，不受此任务调度的影响。

负载说明了什么：当前有多少进程正在等待下一个 1/100 秒时间范围。当然，这是一个平均值。这是因为您可以在 cat /proc/loadavg 中看到多个数字。

多CPU系统中的情况更为复杂。有多个cpu，其时间范围可以给多个进程。这使得任务调度变得有点复杂，但也不是太复杂。但情况是一样的。

内核是智能的，它尝试共享系统资源以获得最佳效率，并且它已经接近这个目标（有一些小的优化，例如，如果一个进程在同一台计算机上运行尽可能长的时间，那就更好了cpu 因为缓存考虑，但它们在那里并不重要）。这是因为如果我们有负载 8，这意味着：实际上有 8 个进程在等待下一个时间片。如果我们有8个CPU，我们可以将这些时间片一对一地分配给CPU，这样我们的系统就会得到最佳的利用。

如果你看到 a top，你会发现实际运行的进程数量出奇的少：它们就是R那里标记的进程。即使在不是真正的硬核系统上，它也通常低于 5。部分原因是等待来自磁盘或网络的数据的进程也被挂起（S在顶部标记为）。负载仅显示CPU使用率。

多核 CPU 实际上是同一硅芯片上的多个 CPU。与此观点没有什么区别。

对于超线程 CPU，存在一个有趣的副作用：加载 CPU 会使其超线程对变慢。但这发生在正常任务调度处理的更深层次上，尽管它可以（并且应该）影响调度程序的进程移动决策。超线程 CPU 目前尚未得到广泛使用。

在 Windows 上，使用不同的方法进行负载计算：负载 1.0 表示全部的 cpu 核心使用率达到 100%（系统上的负载为 4.0）。

^笔记_{正如@Alex 提到的，这不是时间平均值。它是时间常数为 1、5、15 分钟的指数加权时间平均值。它的计算更有效，并且对最近的变化反应更好。有关更多详细信息，请参阅来源kernel/sched/loadavg.c。}

Answer

这3个数字是不是不同 CPU 的编号。

这些数字是平均值^{（看注释）}最后 1 分钟、5 分钟和 15 分钟。

负载的含义如下：如果单 CPU 系统上有多个进程，它们看起来是并行运行的。但事实并非如此。实际发生的情况是：内核为进程提供 1/100 秒，然后通过中断中断其运行。然后将接下来的 1/100 秒交给另一个进程。有时这个1/100可以是1/1000甚至是不断变化的时间限制，这并不重要。

实际上，“哪个进程应该获得下一个 1/100 秒间隔？”这个问题将由复杂的启发式方法决定。它被称为任务调度。

当然，被阻塞的进程，例如正在等待从磁盘读取数据的进程，不受此任务调度的影响。

负载说明了什么：当前有多少进程正在等待下一个 1/100 秒时间范围。当然，这是一个平均值。这是因为您可以在 cat /proc/loadavg 中看到多个数字。

多CPU系统中的情况更为复杂。有多个cpu，其时间范围可以给多个进程。这使得任务调度变得有点复杂，但也不是太复杂。但情况是一样的。

内核是智能的，它尝试共享系统资源以获得最佳效率，并且它已经接近这个目标（有一些小的优化，例如，如果一个进程在同一台计算机上运行尽可能长的时间，那就更好了cpu 因为缓存考虑，但它们在那里并不重要）。这是因为如果我们有负载 8，这意味着：实际上有 8 个进程在等待下一个时间片。如果我们有8个CPU，我们可以将这些时间片一对一地分配给CPU，这样我们的系统就会得到最佳的利用。

如果你看到 a top，你会发现实际运行的进程数量出奇的少：它们就是R那里标记的进程。即使在不是真正的硬核系统上，它也通常低于 5。部分原因是等待来自磁盘或网络的数据的进程也被挂起（S在顶部标记为）。负载仅显示CPU使用率。

多核 CPU 实际上是同一硅芯片上的多个 CPU。与此观点没有什么区别。

对于超线程 CPU，存在一个有趣的副作用：加载 CPU 会使其超线程对变慢。但这发生在正常任务调度处理的更深层次上，尽管它可以（并且应该）影响调度程序的进程移动决策。超线程 CPU 目前尚未得到广泛使用。

在 Windows 上，使用不同的方法进行负载计算：负载 1.0 表示全部的 cpu 核心使用率达到 100%（系统上的负载为 4.0）。

^笔记_{正如@Alex 提到的，这不是时间平均值。它是时间常数为 1、5、15 分钟的指数加权时间平均值。它的计算更有效，并且对最近的变化反应更好。有关更多详细信息，请参阅来源kernel/sched/loadavg.c。}

Question 3

我不知道为什么人们不直接回答这个问题。每个人都用计算机工程语言交谈。

实际上，这些数字是“1”中的负载平均值。如果您的平均负载为“5”，则意味着 CPU 使用率约为 500%，这意味着您的过载率为 400%。（500% - 你的能力 100%）。如果它显示“0.05”，则意味着您仅使用 5% 的 CPU，95% 的 CPU 仍未使用。

以上计算针对 1 核。当您有多个核心时，平均值将除以核心数量/核心数量。例如，如果您有 4 个核心，并且平均值为“10”，则意味着您的 CPU 使用率为：10 / 4 * 100 = 250%

所以，平均值的理想值等于或小于您的“核心数”。 3个值（20.62、18.83、11.31）是最后1分钟、最后5分钟和最后15分钟的平均值。

Answer

我不知道为什么人们不直接回答这个问题。每个人都用计算机工程语言交谈。

实际上，这些数字是“1”中的负载平均值。如果您的平均负载为“5”，则意味着 CPU 使用率约为 500%，这意味着您的过载率为 400%。（500% - 你的能力 100%）。如果它显示“0.05”，则意味着您仅使用 5% 的 CPU，95% 的 CPU 仍未使用。

以上计算针对 1 核。当您有多个核心时，平均值将除以核心数量/核心数量。例如，如果您有 4 个核心，并且平均值为“10”，则意味着您的 CPU 使用率为：10 / 4 * 100 = 250%

所以，平均值的理想值等于或小于您的“核心数”。 3个值（20.62、18.83、11.31）是最后1分钟、最后5分钟和最后15分钟的平均值。

Question 4

在不深入了解“负载”的具体情况的情况下，简单地理解这一点的一种方法是，1 是 CPU 内核在给定时间实际可以处理的负载量。

如果平均负载高于 1，则意味着单个 CPU 核心无法完成更多工作，并且如果只有一个 CPU 核心可用，那么一台长期平均负载高于 1 的计算机将不得不“ “skip”在某些时间片期间将资源分配给某些任务，从而减慢其执行速度。

值得庆幸的是，现代计算机通常有多个 CPU 核心可用，这意味着平均负载为 1 - 这对于单核系统来说会很糟糕；代表固定的 CPU 存在过热或过早故障的危险 - 在四核系统上完全没问题，分布在所有四个核心上。

负载平均值在工作负载变化很大的台式机上相对无用，在工作负载稳定的服务器上，负载平均值可以指示 DoS 攻击、黑客攻击、硬件损坏、硬件升级紧迫性、行为不当的软件等。

像top或vmstat之类的东西更合适，大多数Linux发行版的软件包存储库中也有交互式工具，例如htop和glances，它们有助于实时隔离失控的资源使用情况。

Answer