我在具有 LVM 分区的 ESX 主机上有一个 VMWare VM。我已使用非常基本的配置配置了 kdump -ext /dev/mapper/logical-volume-name
和path /data/crash
。当我强制系统崩溃时,它会加载 kdump 内核并显示逻辑卷,加载它们并显示它正在保存内存转储,大约需要 30 秒才能导出大约 2.5GB,这是正常的。问题是,当它重新启动时,它会恢复,但没有网络连接(无法退出,也无法通过网络进入),但是,所有网络服务都在运行,简单的重新启动(无崩溃)可以解决这个问题。此外,另一个问题- 保存的 vmcore 内存转储实际上并未保存。我在 VirtualBox 上的虚拟机上对此进行了测试,它运行的 CentOS 等效于当前生产环境中存在这些 kdump 问题的 RHEL 服务器。
有什么想法或事情是我应该考虑的吗?
答案1
我与 KDump 的一位开发人员进行了交谈,确认这是一个已知错误。目前,我无法对生产进行任何更改,但我非常怀疑内核需要升级和/或 VM 和 VM Host 之间的某些问题需要检查。
作者:Eric W. Biederman 致德鲁·德克尔 抄送 [电子邮件保护], [电子邮件保护], [电子邮件保护], [电子邮件保护] 日期:2011 年 1 月 25 日星期二下午 1:50 主题 回复:KDump 问题/问题(需要开发人员的眼光) 这听起来像是 RHEL 内核与 VMware 交互时的一个错误。 坦白说,重启不会重置硬件这一事实令人害怕。 此时,任何 RHEL 内核都是旧的,并且尚未被更新 在他们分支期间修复了许多错误 linus 的树和礼物,并且可能带有支持 那些受雇来帮助你的人签订的合同,并了解这些 详细信息,因此我建议你与 Red Hat 的优秀员工交谈。他们 应该能够提供帮助。 通常这类问题归结于某种驱动程序问题,而不是 实际的 kexec 中存在 panic 基础设施问题。尽管在这个 我还会怀疑 kdump 内核是如何调用重启的。 祝你好运, 埃里克