尽管 CPU 100% 空闲,但无头服务器上的系统负载为 2

尽管 CPU 100% 空闲,但无头服务器上的系统负载为 2

我的计算机在完全空闲时始终显示负载为 2+。

重要的是,这种情况最近有所改变。以前,当不执行任何操作时,负载会显示 0.x。

我读到过,Linux 下的负载比“CPU 消耗”更抽象一些,所以它可能不一定是 2 个核心全速运行,但我无法追踪是什么导致了负载的增加,我想知道这是否是需要担心的事情。

最近发生的唯一异常情况(除了电源故障)是 NVIDIA 驱动程序自动更新。我怀疑驱动程序可能是原因,但可能是完全不同的原因? (更新:卸载所有 nvidia 驱动程序,然后重新启动,仍然会导致 2.0 在空闲时加载。)

以下是“top”显示的内容:

top - 10:52:21 up 17:19,  1 user,  load average: 2.11, 2.23, 2.18
Tasks: 405 total,   1 running, 404 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
MiB Mem : 128172.1 total, 123776.2 free,   4116.7 used,    279.2 buff/cache
MiB Swap: 244198.3 total, 244198.3 free,      0.0 used. 123088.9 avail Mem

    PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
    293 root      20   0       0      0      0 S   0.3   0.0   0:49.72 nv_queue
    380 root      20   0       0      0      0 S   0.3   0.0   0:33.05 l2arc_feed
    548 root      20   0       0      0      0 S   0.3   0.0   0:21.51 txg_sync
      1 root      20   0  166672   8448   5248 S   0.0   0.0   0:01.40 systemd
...

并且“w”或“uptime”通常显示精确的 2.00 负载:

 11:16:15 up 17:43,  1 user,  load average: 2.00, 2.00, 2.02

‘sudo vmstat 5’的输出:

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd      free   buff  cache   si   so    bi    bo   in   cs us sy  id wa st
 1  0      0 129697456   3088 224968    0    0     3    28   14   16  0  0 100  0  0
 0  0      0 129697544   3088 224980    0    0     0   272  239  270  0  0 100  0  0
 0  0      0 129697320   3088 224980    0    0     0  2147  253  341  0  0 100  0  0
 0  0      0 129697320   3088 224984    0    0     0   245  195  238  0  0 100  0  0
 0  0      0 129697320   3088 224984    0    0     0   821  209  259  0  0 100  0  0
 0  0      0 129697320   3088 224984    0    0     0     0   81   77  0  0 100  0  0
 0  0      0 129697320   3088 224984    0    0     0     0   69   73  0  0 100  0  0
 0  0      0 129697320   3088 224984    0    0     0     0   65   66  0  0 100  0  0
 0  0      0 129697320   3088 224984    0    0     0   259  198  244  0  0 100  0  0

自从注意到异常负载后,我尝试了一些基本方法以及更多方法:

  • 重启
  • 电源周期
  • apt 升级 + 重启
  • 卸载所有 Nvidia 驱动程序
  • zpool scrub,rpool 和 bpool
  • 强制关机 30 分钟以上
  • 重置 BIOS 设置

... 系统空闲时 2.0 负载没有变化。

系统配置:

  • Ubuntu 22.04.4 LTS(桌面版,但禁用了 X)
  • Linux xxx 6.5.0-21-通用#21~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC 2 月 9 日星期五 13:32:52 UTC 2 x86_64 x86_64 x86_64 GNU/Linux
  • AMD 锐龙 5 5600G
  • 128GB 内存
  • 2 个 Nvidia P40 GPU
  • 配备 2 X 2TB HDD + 128GB NVMe SSD(缓存)的 ZFS
  • NVRM 版本:NVIDIA UNIX x86_64 内核模块 535.161.07 2024 年 2 月 17 日星期六 22:55:48 UTC

请注意,从 USB 启动 Ubuntu 22.04 LTS 几分钟后负载会返回到 0.00!!!

谢谢你的帮助。

相关内容