它在 AIX 版本:7、发行版:2、powerppc 上运行。
我有一个挂起的进程,其输出ps -ef -o THREAD
是:
USER PID PPID TID ST CP PRI SC WCHAN F TT BND COMMAND
...
root 17105192 16646578 - A 0 60 1 f1000c01503c95d0 240001 - -1 /bin/bash thecommand.sh
我的理解是, 的值WCHAN
与进程正在等待的内容有关,但我不明白是什么f1000c01503c95d0
意思。
/proc/17105192
没有wchan
文件sudo procmap -X 17105192
显示:
并且Start-ADD End-ADD SIZE MODE PSIZ TYPE VSID MAPPED OBJECT 0 10000000 262144K r-- m KERTXT 10002 100000000 1001c8a4a 1826K r-x s MAINTEXT 830686 bash 1100009f5 1100213c0 130K rw- sm MAINDATA 881311 bash 1100213c0 110041400 128K rw- sm HEAP 881311 800200140000000 8002001400e5000 916K r-- sm KER/LDR 8e9a9c 8fffffff0000000 900000000000000 262144K r-- s KER/LDR 866ecc 900000000000d80 90000000048ac87 4647K r-x m SLIBTEXT 8c8019 /usr/lib/libc.a[shr_64.o] 9000000004b1220 9000000004b1c7e 2K r-x m SLIBTEXT 8c8019 /usr/lib/libcrypt.a[shr_64.o] ...
1000c01503c95d0
不属于任何这些范围。sudo procfiles -n 17105192
显示:
像这样的条目有4个。 “无法检索”是可疑的。使用和搜索该节点 (17105192 : /bin/bash thecommand.sh Current rlimit: 9223372036854775807 file descriptors 0: S_IFIFO mode:00 dev:268435455,-1 ino:9352269 uid:0 gid:0 rdev:0,0 O_RDONLY name:Cannot be retrieved ...
9352269
)没有找到任何内容。ncheck
find
有没有办法更多地了解这里发生的事情?有没有办法验证该WCHAN
值是什么?
编辑:今天得到了线索。卡住进程的父进程都是 sshd,今天我意识到我能够执行“ssh xxxxxx”,但“ssh xxxxxx some_command”挂起。当我尝试“ssh -t xxxxxx some_command”时,我收到一条通知“NFS 服务器 someserver 未响应仍在尝试”。我怀疑交互式 shell 正在运行,但非交互式 shell(例如运行被锁定的进程的 shell)却因我们的一台 NFS 服务器已停用并且没有人从该服务器上删除挂载这一事实而挂起。我能够在其他几乎相同的没有安装的服务器上执行非交互式命令。当我获得删除安装的许可时,我会更新这个问题。感谢大家的帮助和好问题。 (另外,我很可能将“交互式 shell”与“登录 shell”混淆,因为我永远记不起区别)