所以我的服务器最近已经锁定两次了。
我想要做的是捕获写入串行控制台的任何内核崩溃/错误。我可以通过 ssh 进入并启动 VSP,并且我正在使用脚本在 bash 中运行我的 SSH 会话,因此写入控制台的任何内容都应由脚本记录。
问题是 iLO 超时并关闭 SSH 会话。
快速查看 Web 界面会发现存在 iLO 空闲超时,但只能将其设置为最长 120 分钟且不能禁用。
有没有什么方法可以禁用 iLO 关闭 SSH 会话,这样我就可以有效地记录一段时间内通过虚拟串行端口输出的内容,并希望能够捕捉到这些看似随机的锁定所引发的任何恐慌/糟糕情况。
答案1
您在系统的 IML 日志中看到什么了吗?您是否为硬件安装了管理代理?
什么具体的您使用的 ProLiant 服务器的操作系统和型号是什么?如果您安装了代理,您应该会得到一些与锁定或可能触发 ASR 看门狗计时器相关的信息。
对于 VSP,您是否对内核命令行和 Grub输出到控制台?
对于 ILO,型号和固件版本有所不同。当前的 ILO2 和 ILO3 固件允许无穷下的空闲超时Access Options
。
答案2
如果您可以使用 PuTTY,也许您可以防止发生超时......
答案3
我不确定 ilo 的 SSH 实现是否支持它,但使用 openssh 客户端和设置ServerAliveInterval
可能会有所帮助。它默认为 0。我使用它来保持我的 ssh 连接处于活动状态,以防止 nat 表计时器超时。输入~/.ssh/config
:
ServerAliveInterval 60