无法使用 crashkernel 让 kdump 转储 vmcore

Question 1

这可能与此问题有关： https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1421391

Answer

这可能与此问题有关： https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1421391

Question 2

只是一个想法 - 尝试禁用一些与 kdump 集合无关的内存密集型模块，我已经看到许多高性能网络驱动程序在工作中导致 OOM，而且我的家用机器确实有高端显卡，这两个例子都导致在 kdump 上加载大量内存，导致内存短缺，毕竟保留的 kdump 内存只是主机上安装的 RAM 的一小部分，因为它在启动时保留，之后不可用。

因此，要确定哪些模块消耗了大量内存：

 $ lsmod | sort -nk2 -r | head
amdgpu               4116480  16
btrfs                1228800  2
kvm                   655360  0
nfsv4                 638976  2
drm                   487424  8 gpu_sched,drm_kms_helper,amdgpu,ttm
sunrpc                380928  9 nfsv4,auth_rpcgss,lockd,rpcsec_gss_krb5,nfs
aesni_intel           372736  0
fscache               368640  2 nfsv4,nfs
nfs                   299008  2 nfsv4
igb                   221184  0

就我而言，amdgpu 位于顶部，但您可以拥有我在工作中遇到的所有模块，例如ixgbe，，，等等。i40emlx5_core

要仅为 kdump 内核禁用这些，请编辑/etc/default/kdump-tools和取消注释（也许复制，然后取消注释）KDUMP_CMDLINE_APPEND，然后添加要列入黑名单的驱动程序。有些可能在内核中，有些在 initrd 中，因此为确保万无一失，请将每个驱动程序添加为和$driver_name.blacklist=1，rd.driver.blacklist=$driver_name如下所示amdgpu：

[snip]
#KDUMP_CMDLINE_APPEND="reset_devices systemd.unit=kdump-tools-dump.service nr_cpus=1 irqpoll nousb ata_piix.prefer_ms_hyperv=0"
KDUMP_CMDLINE_APPEND="reset_devices systemd.unit=kdump-tools-dump.service nr_cpus=1 irqpoll nousb ata_piix.prefer_ms_hyperv=0 amdgpu.blacklist=1 rd.driver.blacklist=amdgpu"
[snip]

然后只需重新加载 kdump-tools 并确保新配置已加载：

$ sudo systemctl restart kdump-tools
$ kdump-config show
DUMP_MODE:        kdump
USE_KDUMP:        1
KDUMP_SYSCTL:     kernel.panic_on_oops=1
KDUMP_COREDIR:    /var/crash
crashkernel addr: 0x
   /var/lib/kdump/vmlinuz: symbolic link to /boot/vmlinuz-5.3.0-40-lowlatency
kdump initrd: 
   /var/lib/kdump/initrd.img: symbolic link to /var/lib/kdump/initrd.img-5.3.0-40-lowlatency
current state:    ready to kdump

kexec command:
  /sbin/kexec -p --command-line="BOOT_IMAGE=/@/boot/vmlinuz-5.3.0-40-lowlatency root=UUID=a745358b-a4e6-4a16-a347-5fa3d65e78a7 ro rootflags=subvol=@ quiet splash vt.handoff=1 reset_devices systemd.unit=kdump-tools-dump.service nr_cpus=1 irqpoll nousb ata_piix.prefer_ms_hyperv=0 amdgpu.blacklist=1 rd.driver.blacklist=amdgpu" --initrd=/var/lib/kdump/initrd.img /var/lib/kdump/vmlinuz

然后重试收集。

干杯，T。

Answer