刚刚更新的两台服务器上的进程卡住了

刚刚更新的两台服务器上的进程卡住了

就在昨晚,在几个 RHEL 服务器上运行了 yum 更新,我确实设法获得了软件包列表,但至少其中一个似乎导致了一个大问题。

问题是,两台服务器的 SSH 似乎随机“掉线”。它实际上并没有断开,只是冻结了。即使设置了 DEBUG LogLevel,服务器端的 SSH 日志看起来也很正常。有时它会在“上次登录:”行出现后立即挂起,有时它会持续一段时间,但最终总会挂起(即使有持续的活动发生)。我最初以为这可能是 MTU 或其他原因,但什么都没有改变,其他运行 CentOS 而不是 RHEL 的服务器,但昨天没有获得 yum 更新,通过相同的 VPN 连接完全正常。

我的问题是,我似乎没有办法解决这个问题,我尝试回滚 yum 事务,但 SSH 在此期间冻结并导致其停止工作。奇怪的是,即使我设法打开屏幕,并设置 yum 运行以进行回滚,回滚实际上也会停止,就像 SSH 冻结一样,但我仍然可以从屏幕分离。这导致 yum 在进程列表中显示为休眠状态,我必须在强制终止屏幕会话后将其杀死。任何建议都将不胜感激。

编辑:两台服务器都运行 RHEL 6.3

EDIT2:一些进一步的信息...看起来 SSH 连接仍然处于活动状态,因为我仍然在我认为已经断开的连接上收到来自 syslog 等的消息:

[root@www www]# ls -la
^C^C
Message from syslogd@www at Feb 16 20:18:21 ...
   Message text
^C^C

在我按下前两次 Ctrl + C 和弹出消息之间大约有一个小时的时间,然后你会看到之后按下的 Ctrl + C 也没有发生任何反应。它只是有点...卡住了。

EDIT3:我尝试通过更改 GRUB 默认值恢复到早期的内核,但问题仍未解决。

EDIT4:有更多信息。通过 IPMI 进入后,我遇到了同样的问题,所以这与 SSH 无关,实际上是另一个问题。不过幸运的是,我现在能够获得完全相同的堆栈跟踪,并且它们挂在完全独立的两台机器上的同一位置(尽管硬件相同)。

https://dl.dropbox.com/u/28404486/bash_hang.jpg

相关内容