我有一台在虚拟机上运行 Ubuntu 18.04 的 Linux 服务器。执行任何类似ls -l
或频繁的任务w
都需要几秒钟才能完成。strace -c ls -l
说ls
只需要几毫秒,但是运行了strace -c strace -c ls -l
很多次直到问题发生告诉我clone()系统调用导致了问题:
% time seconds usecs/call calls errors syscall
------ ----------- ----------- --------- --------- ----------------
99.33 1.374858 687429 2 clone
0.31 0.004273 8 548 1 wait4
0.20 0.002701 2 1088 ptrace
0.10 0.001416 1 1096 rt_sigprocmask
0.01 0.000130 6 22 mmap
...
------ ----------- ----------- --------- --------- ----------------
100.00 1.384096 2893 15 total
我运行的每个诊断似乎都正常:RAM/CPU 使用情况、进程/线程计数、IO 性能等。一切都是最新的。该问题在几周前随机开始出现,并在重新启动后仍然存在。有人知道可能导致此问题的任何事情吗?在当前状态下,服务器几乎毫无用处。