top 命令 - 进程的 CPU 没有加起来

Question 1

您正在比较的这两条信息不会匹配，因为它们是从不同的文件收集的。也就是说，尽管 top 在同一个终端中显示信息，但它们不是从同一个来源收集的。

我只是在上面运行了一个 strace（以批处理模式运行）。它在这里显示系统范围的 CPU 信息。

16:04:04.081092 open("/proc/stat", O_RDONLY) = 6 <0.000022>
16:04:04.081154 lstat("/proc", {st_mode=S_IFDIR|0555, st_size=0, ...}) = 0 <0.000015>
16:04:04.081211 lstat("/proc/stat", {st_mode=S_IFREG|0444, st_size=0, ...}) = 0     <0.000013>
16:04:04.081267 fstat(6, {st_mode=S_IFREG|0444, st_size=0, ...}) = 0 <0.000013>
16:04:04.081334 fstat(6, {st_mode=S_IFREG|0444, st_size=0, ...}) = 0 <0.000013>
16:04:04.081385 mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f699ace2000 <0.000016>
16:04:04.081440 lseek(6, 0, SEEK_SET)   = 0 <0.000013>
16:04:04.081494 read(6, "cpu  302573 6910 83103 10092403 "..., 1024) = 1024 <0.000070>
16:04:04.081656 write(1, "%Cpu(s):  2.9 us,  0.8 sy,  0.1 "..., 80) = 80 <0.000034>
16:04:04.081763 write(1, "KiB Mem:   8048484 total,  41402"..., 73) = 73 <0.000035>
16:04:04.081858 write(1, "KiB Swap:  8060924 total,       "..., 72) = 72 <0.000034>
16:04:04.081940 write(1, "\n", 1)       = 1 <0.000026>

现在，如果您看到/proc/stat，它会显示系统的所有 CPU。top 也知道这一点，因为在打开 /proc/stat 之前，它会打开 sys 文件系统。

16:04:03.367339 open("/sys/devices/system/cpu/online", O_RDONLY|O_CLOEXEC) = 3 <0.000027>
16:04:03.367408 read(3, "0-7\n", 8192)  = 4 <0.000019>
16:04:03.367464 close(3)                = 0 <0.000015>

现在，当涉及到收集单个进程信息时，它会从文件中获取信息/proc/pid/statm。/proc/pid/stat（用实际的 pid 替换 pid）。

如您所见，/proc/stat系统范围的信息是全部CPU 和 pid 的单独 proc 文件是其特定的仅 pid 信息。

因此，它们不会匹配。

Answer

您正在比较的这两条信息不会匹配，因为它们是从不同的文件收集的。也就是说，尽管 top 在同一个终端中显示信息，但它们不是从同一个来源收集的。

我只是在上面运行了一个 strace（以批处理模式运行）。它在这里显示系统范围的 CPU 信息。

16:04:04.081092 open("/proc/stat", O_RDONLY) = 6 <0.000022>
16:04:04.081154 lstat("/proc", {st_mode=S_IFDIR|0555, st_size=0, ...}) = 0 <0.000015>
16:04:04.081211 lstat("/proc/stat", {st_mode=S_IFREG|0444, st_size=0, ...}) = 0     <0.000013>
16:04:04.081267 fstat(6, {st_mode=S_IFREG|0444, st_size=0, ...}) = 0 <0.000013>
16:04:04.081334 fstat(6, {st_mode=S_IFREG|0444, st_size=0, ...}) = 0 <0.000013>
16:04:04.081385 mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f699ace2000 <0.000016>
16:04:04.081440 lseek(6, 0, SEEK_SET)   = 0 <0.000013>
16:04:04.081494 read(6, "cpu  302573 6910 83103 10092403 "..., 1024) = 1024 <0.000070>
16:04:04.081656 write(1, "%Cpu(s):  2.9 us,  0.8 sy,  0.1 "..., 80) = 80 <0.000034>
16:04:04.081763 write(1, "KiB Mem:   8048484 total,  41402"..., 73) = 73 <0.000035>
16:04:04.081858 write(1, "KiB Swap:  8060924 total,       "..., 72) = 72 <0.000034>
16:04:04.081940 write(1, "\n", 1)       = 1 <0.000026>

现在，如果您看到/proc/stat，它会显示系统的所有 CPU。top 也知道这一点，因为在打开 /proc/stat 之前，它会打开 sys 文件系统。

16:04:03.367339 open("/sys/devices/system/cpu/online", O_RDONLY|O_CLOEXEC) = 3 <0.000027>
16:04:03.367408 read(3, "0-7\n", 8192)  = 4 <0.000019>
16:04:03.367464 close(3)                = 0 <0.000015>

现在，当涉及到收集单个进程信息时，它会从文件中获取信息/proc/pid/statm。/proc/pid/stat（用实际的 pid 替换 pid）。

如您所见，/proc/stat系统范围的信息是全部CPU 和 pid 的单独 proc 文件是其特定的仅 pid 信息。

因此，它们不会匹配。

Question 2

采样（即top测量 CPU 使用率的方法）容易产生误差。

最好的解释方式是这样的：想象一家工厂每小时只生产一辆汽车。假设你决定对该工厂生产汽车的速度进行抽样。你从 5:59 开始抽样，在 7:01 停止抽样。你看到生产了两辆汽车，一辆在 6:00，另一辆在 7:00。你抽样了 62 分钟，生产了 2 辆汽车。因此，你计算出该工厂生产汽车的产能约为其额定产能的 200%。

此外，您无法top相互比较值，因为top它没有为您提供单个系统状态的一组测量值，而是提供一组独立的测量值，每个测量值都受其自己的条件集的影响。

例如，每个 CPU 的值可以使用与每个进程的值完全不同的机制来计算。每个 CPU 的值可以呈指数衰减，而每个进程的值可以是两个总数之间的差值。因此，它们可以反映同一类型事物的测量结果，但使用完全不同的方法。

Answer

采样（即top测量 CPU 使用率的方法）容易产生误差。

最好的解释方式是这样的：想象一家工厂每小时只生产一辆汽车。假设你决定对该工厂生产汽车的速度进行抽样。你从 5:59 开始抽样，在 7:01 停止抽样。你看到生产了两辆汽车，一辆在 6:00，另一辆在 7:00。你抽样了 62 分钟，生产了 2 辆汽车。因此，你计算出该工厂生产汽车的产能约为其额定产能的 200%。

此外，您无法top相互比较值，因为top它没有为您提供单个系统状态的一组测量值，而是提供一组独立的测量值，每个测量值都受其自己的条件集的影响。

例如，每个 CPU 的值可以使用与每个进程的值完全不同的机制来计算。每个 CPU 的值可以呈指数衰减，而每个进程的值可以是两个总数之间的差值。因此，它们可以反映同一类型事物的测量结果，但使用完全不同的方法。

top 命令 - 进程的 CPU 没有加起来

答案1

答案2

相关内容