这有点令人费解。我有 28 个虚拟机,在 ESXi 5.5 上运行,每个虚拟机分配有 6 个 vcpu。它们没有特别加载,并且除了每个 Java 进程之外不运行任何其他东西。当我在其中任何一个上运行 top 并显示各个 CPU 输出时,它们基本上都是这样的:
top - 21:00:15 up 6 days, 12:52, 1 user, load average: 0.89, 0.85, 0.82
Tasks: 110 total, 1 running, 108 sleeping, 0 stopped, 1 zombie
Cpu0 : 3.7%us, 0.3%sy, 0.0%ni, 96.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1 : 38.4%us, 3.0%sy, 0.0%ni, 51.9%id, 0.0%wa, 1.3%hi, 5.4%si, 0.0%st
Cpu2 : 2.7%us, 0.3%sy, 0.0%ni, 96.6%id, 0.0%wa, 0.0%hi, 0.3%si, 0.0%st
Cpu3 : 3.7%us, 0.7%sy, 0.0%ni, 95.6%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu4 : 3.4%us, 0.3%sy, 0.0%ni, 96.0%id, 0.0%wa, 0.0%hi, 0.3%si, 0.0%st
Cpu5 : 4.0%us, 0.7%sy, 0.0%ni, 95.0%id, 0.0%wa, 0.0%hi, 0.3%si, 0.0%st
Mem: 12168008k total, 7323476k used, 4844532k free, 405332k buffers
Swap: 4194296k total, 0k used, 4194296k free, 1198540k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
20543 root 18 0 5704m 303m 18m S 64.6 2.6 555:03.29 java
25873 root 15 0 90152 3336 2604 S 0.3 0.0 0:00.02 sshd
25952 root 15 0 12760 1276 944 R 0.3 0.0 0:00.01 top
在每台服务器上,Cpu1 是唯一显示具有任何负载的 cpu。它永远不会移动到任何其他CPU。两周前就注意到了这一点。此后,所有内容均已重新启动,并且行为仍然相同。没有为该进程设置关联性:
# taskset -p $(pgrep java)
pid 20543's current affinity mask: 3f
如果我观察处于非睡眠状态的各个线程,如下所示:
# cd /proc/$(pgrep java)/task
# while true; do awk '($3 != "S") { print "LWPID: " $1 " CPU: " $39}' */stat; sleep 5; echo -; done
他们似乎跳到各种 CPU 上。
# cat /etc/redhat-release
CentOS release 5.7 (Final)
# uname -a
Linux ----- 2.6.18-274.18.1.el5 #1 SMP Thu Feb 9 12:45:44 EST 2012 x86_64 x86_64 x86_64 GNU/Linux
# java -version
java version "1.7.0_13"
Java(TM) SE Runtime Environment (build 1.7.0_13-b20)
Java HotSpot(TM) 64-Bit Server VM (build 23.7-b01, mixed mode)
# top --version
top: procps version 3.2.7
有人知道为什么它们总是出现在单个 CPU 上吗?
答案1
当机器实际上不需要分散负载时,它可能会选择只唤醒一个 CPU。
每个进程都会看到一个有空闲时间的唤醒 CPU,并且更喜欢它。