我诚挚地表示歉意,但对于一个问题来说,这可能只是一个不明确的问题。
我运行的是 Linux VPS,我认为它存在严重的性能问题,但我无法确定它是什么或可能是什么。我联系了支持人员,但他们说他们没有发现任何问题。为了获得进一步的支持,我必须付费。
我是一名经验丰富的软件工程师,对 DevOps 有一些见解。我想先尽可能多地了解自己。
最明显的症状:
- 通过 ssh 登录时,shell 中的执行速度很慢。这在很大程度上可以归因于位置延迟(我在南美,服务器位于欧洲)。但并非全部,因为:
- 有时,尤其是当我执行耗 CPU 的东西时,我实际上可以观察到进程好像缺少 CPU。它只是停止,就像它在结巴(也许他们在限制它或做其他事情?),然后继续。之后的处理阶段
sudo apt full-upgrade
需要很长时间,而且看起来并不顺利。 - 我也在那里运行一个网络服务器,有时响应非常快,但经常超时(例如,当我通过浏览器运行 nextcloud 更新时,我必须在每一步之后重新加载,因为它会丢失连接)。
一些信息:
uname -a
Linux 4.15.0-147-generic #151-Ubuntu SMP Fri Jun 18 19:21:19 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux
硬件:
CPU Information
Name QEMU Virtual version 2.5+
Topology 4 Processors, 4 Cores
Base Frequency 3.50 GHz
L1 Instruction Cache 32.0 KB x 1
L1 Data Cache 32.0 KB x 1
L2 Cache 4.00 MB x 1
L3 Cache 16.0 MB x 1
Memory Information
Memory 7.60 GB
在 CPU 上运行 sysbench:
sysbench --test=cpu run
WARNING: the --test option is deprecated. You can pass a script name or path on the command line without any options.
sysbench 1.0.11 (using system LuaJIT 2.1.0-beta3)
Running the test with following options:
Number of threads: 1
Initializing random number generator from current time
Prime numbers limit: 10000
Initializing worker threads...
Threads started!
CPU speed:
events per second: 1094.64
General statistics:
total time: 10.0008s
total number of events: 10949
Latency (ms):
min: 0.83
avg: 0.91
max: 101.27
95th percentile: 0.94
sum: 9991.70
Threads fairness:
events (avg/stddev): 10949.0000/0.00
execution time (avg/stddev): 9.9917/0.00
与我在那里看到的其他东西相比,Geekbench 得分似乎非常低。
515
Single-Core Score
1629
Multi-Core Score
完整的 geekbench 输出:https://browser.geekbench.com/v5/cpu/12431904
我将非常感激任何提示或建议。如果需要,很乐意提供更多信息。
编辑:感谢下面的评论,我检查了窃取时间。它似乎偶尔会飙升至最高 4.8%,但大多数时候都在 0.1 左右,所以我不认为这是真正的罪魁祸首。
奇怪的是,如果我运行一个 CPU 密集型进程,CPU 似乎处于 100%,但空闲量仍然报告非常高,而用户量似乎很低。还反复出现 khugepaged 峰值,我不知道如何解释。我想继续调试...