我们有点困惑。偶尔ps
/w
会在我们的服务器上永远挂起(至少一个小时),并且它正在读取/proc/pid/cmdline
某个进程(今天发生了两次,strace cat
直接在 上进行了验证cmdline
)。唯一能解决这个问题的是kill -9
。
服务器上没有运行任何容器,也没有 OOM 情况(实际上有超过 3TB 的内存可用)。没有 NFS 或其他网络文件系统。
运行5.19.0-1019-aws #20~22.04.1-Ubuntu SMP Thu Jan 26 11:24:23 UTC 2023 x86_64 x86_64 x86_64 GNU/Linux
Ubuntu 22,它是一个高核心数和高内存的 NUMA 系统。
挂起期间,有问题的进程处于 S 或 Z 状态。
我们阅读了以下内容,但它对我们没有帮助:
ChatGPT4 被难住了。
有什么想法吗?谢谢!