我们目前在 RHEL 5.6 服务器上遇到了一个问题。服务器随机变得不稳定,内核等待消息显示在 /var/log/messages 中,并且我们现在已经重新启动了两次。我们已将所有可用信息发送给 Red Hat,但为了进一步排除故障,他们表示需要设置 kdump 和 kexec,其中包括以下内容:
- 在 chkconfig 中启用 kdump 服务
- 在 /etc/sysctl.conf 中将 hung_task_panic 设置为 1
- 在 grub.conf 中添加 crashkernel=128M,为内核转储设置内存驻留监视器
我最担心的是内存驻留方面。之前有其他人启用过内核核心转储吗?内存驻留是否对性能有重大影响?我只是想听听其他人的经验反馈。
答案1
我设置 kdump 时,没有看到任何性能影响。但是,我看到系统停止恐慌,这让我很反感。希望你的恐慌不会消失,你可以真正找到根本原因!
答案2
运行 kdump 不会受到任何惩罚,但您不应该这样做。
如果你的系统不稳定,我想知道你是否尝试过其他故障排除方法?你说过关于 HP ProLiant 设备过去。相关硬件是否有 IML 日志,或者它是否指示了其 ILO(或 DRAC、IPMI 等)中存在的问题?
鉴于您使用的是 RHEL 5.6,并且当前版本是 5.9,因此很有可能遇到错误或与硬件的不良交互。
答案3
内存驻留是否会对性能产生重大影响?
不应该有任何性能影响。