kdump 无法记录服务器崩溃事件

Question 1

如果/boot位于单独的分区上，Ubuntu 上的内核崩溃转储将由于 ---> 而失败漏洞它在 14.04 Trusty 中仍然存在，你能相信吗？至少对于使用 LVM 和单独的/boot.

解决方法是

unmount /boot然后将其安装到其他安装点，例如/mnt
将内容复制到/boot（与位于同一块设备上的那个/）。例如rsync -axHAX --progress --stats /mnt/ /boot
使用以下方式触发崩溃echo c | sudo tee /proc/sysrq-trigger
如果一切顺利，您将看到以/var/crash(uname -r)-yyyymmddHHmm.crash 形式出现的内核崩溃转储以及带有 dmesg 和 dump 的 yyyymmddHHmm 目录。

如果您想分析崩溃转储，您将需要crash，请按如下所示运行它：

crash /usr/lib/debug/boot/vmlinux-$(uname -r) /var/crash/yyyymmddHHmm/dump.yyyymmddHHmm

有关崩溃的更多信息，请阅读手册。

/etc/default/kdump-tools顺便说一句：更改后不要忘记重新加载 kdump-tools 配置kdump-config load。

Answer

如果/boot位于单独的分区上，Ubuntu 上的内核崩溃转储将由于 ---> 而失败漏洞它在 14.04 Trusty 中仍然存在，你能相信吗？至少对于使用 LVM 和单独的/boot.

解决方法是

unmount /boot然后将其安装到其他安装点，例如/mnt
将内容复制到/boot（与位于同一块设备上的那个/）。例如rsync -axHAX --progress --stats /mnt/ /boot
使用以下方式触发崩溃echo c | sudo tee /proc/sysrq-trigger
如果一切顺利，您将看到以/var/crash(uname -r)-yyyymmddHHmm.crash 形式出现的内核崩溃转储以及带有 dmesg 和 dump 的 yyyymmddHHmm 目录。

如果您想分析崩溃转储，您将需要crash，请按如下所示运行它：

crash /usr/lib/debug/boot/vmlinux-$(uname -r) /var/crash/yyyymmddHHmm/dump.yyyymmddHHmm

有关崩溃的更多信息，请阅读手册。

/etc/default/kdump-tools顺便说一句：更改后不要忘记重新加载 kdump-tools 配置kdump-config load。

Question 2

可能是预留内存太小了（我的问题就是这个原因导致的）。

我认为你应该从三个步骤检查正确的事情。首先，按照[Ubuntu 内核崩溃转储]检查你的配置：https://help.ubuntu.com/lts/serverguide/kernel-crash-dump.html

第二dmesg|grep -i crash，检查预留内存是否正常。

第三，service kdump-tools status检查加载kdump内核是否正常。

第三步，日志很重要，查看/var/log/syslog日志，然后找出原因。

Answer

可能是预留内存太小了（我的问题就是这个原因导致的）。

我认为你应该从三个步骤检查正确的事情。首先，按照[Ubuntu 内核崩溃转储]检查你的配置：https://help.ubuntu.com/lts/serverguide/kernel-crash-dump.html

第二dmesg|grep -i crash，检查预留内存是否正常。

第三，service kdump-tools status检查加载kdump内核是否正常。

第三步，日志很重要，查看/var/log/syslog日志，然后找出原因。

细节：