kdump 问题 - 不保存内存转储/网络问题

kdump 问题 - 不保存内存转储/网络问题

我在具有 LVM 分区的 ESX 主机上有一个 VMWare VM。我已使用非常基本的配置配置了 kdump -ext /dev/mapper/logical-volume-namepath /data/crash。当我强制系统崩溃时,它会加载 kdump 内核并显示逻辑卷,加载它们并显示它正在保存内存转储,大约需要 30 秒才能导出大约 2.5GB,这是正常的。问题是,当它重新启动时,它会恢复,但没有网络连接(无法退出,也无法通过网络进入),但是,所有网络服务都在运行,简单的重新启动(无崩溃)可以解决这个问题。此外,另一个问题- 保存的 vmcore 内存转储实际上并未保存。我在 VirtualBox 上的虚拟机上对此进行了测试,它运行的 CentOS 等效于当前生产环境中存在这些 kdump 问题的 RHEL 服务器。

有什么想法或事情是我应该考虑的吗?

答案1

我与 KDump 的一位开发人员进行了交谈,确认这是一个已知错误。目前,我无法对生产进行任何更改,但我非常怀疑内核需要升级和/或 VM 和 VM Host 之间的某些问题需要检查。

作者:Eric W. Biederman
致德鲁·德克尔
抄送  [电子邮件保护][电子邮件保护][电子邮件保护][电子邮件保护]
日期:2011 年 1 月 25 日星期二下午 1:50
主题 回复:KDump 问题/问题(需要开发人员的眼光)

这听起来像是 RHEL 内核与 VMware 交互时的一个错误。

坦白说,重启不会重置硬件这一事实令人害怕。

此时,任何 RHEL 内核都是旧的,并且尚未被更新
在他们分支期间修复了许多错误
linus 的树和礼物,并且可能带有支持
那些受雇来帮助你的人签订的合同,并了解这些
详细信息,因此我建议你与 Red Hat 的优秀员工交谈。他们
应该能够提供帮助。

通常这类问题归结于某种驱动程序问题,而不是
实际的 kexec 中存在 panic 基础设施问题。尽管在这个
我还会怀疑 kdump 内核是如何调用重启的。

祝你好运,
埃里克

相关内容