有时,在我们的某些服务器上,我们似乎会遇到(到目前为止)只有重新启动才能解决的问题。症状是登录缓慢和 sudo 命令。这些似乎与超时有关/run/dbus/system_bus_socket
。
跑步:
kernel-4.18.0-425.10.1.el8_7.x86_64
systemd-239-68.el8_7.2.x86_64
(计划尽快安装最新的操作系统补丁)
其他详情:
kworker/0:0+events
消耗约 100% 的 CPU 核心- 尝试运行 systemctl 命令通常会导致“无法获取属性:连接超时”
systemd-logind
未运行并且不会启动(日志似乎显示类似的“连接超时”消息,可能与上述一般 systemctl 问题有关- 僵尸数量过多
特别有趣的是:我有来自不同供应商的硬件的异构组合,到目前为止,这个问题似乎只发生在一种特定的硬件型号上,这让我认为可能是硬件/固件问题。或者,某些资源可能需要针对特定硬件进行调整,但我尚不知道。但它并不完全一致——到目前为止,它只出现在相对少数的特定服务器模型上。
Google 向我指出了人们遇到的一些有点类似的 systemd/dbus 问题,但到目前为止,其他人提出的恢复系统的技巧都没有在这里起作用 - 除了重新启动之外没有任何成功,所以远的。
希望也许有人最近遇到过这个问题,并可能找到了罪魁祸首,或者至少可以向我指出其他东西来帮助诊断。