升级到 18.04 后 Boot.mount 失败

升级到 18.04 后 Boot.mount 失败

我们许多从 16.04 升级到 18.04 的服务器都出现过这个问题。常见的配置是 root 是 LVM,并且有 /boot 分区,或者 /boot 和 /boot/efi 分区。例如:

$ lsblk -f
NAME                         FSTYPE      LABEL UUID                                   MOUNTPOINT
sda                                                                                   
├─sda1                       vfat              C45F-2000                         /boot/efi     
├─sda2                       ext2              a906fd59-cb58-4c94-8560-5d426e4   /boot
└─sda3                       LVM2_member       1P3Rxv-VZMx-gcs9-PlxM-DCI8-kIqr
  ├─node--007--vg-root       ext4              316678d5-aaaf-43bd-bac6-cc3aeb1   /
  ├─node--007--vg-swap_1     swap              0724b0b0-9f2d-42aa-bbe2-7b8aa31   [SWAP]
  ├─node--007--vg--na      ext4              7d42481b-f7fb-4ac6-9cf5-5df3ca17   /cache/na
  ├─node--007--vg-c        ext4              e38d96f8-6afb-4d2c-94cc-28a02e90   /cache/c
  └─node--007--vg-t        ext4              44559b67-869e-4454-b792-792c1a16   /cache/d

使用内核调试日志时,我总是看到这种关于等待设备超时的日志

Mar 30 16:14:22 ns1 systemd-udevd[539]: seq 3206 '/devices/pci0000:00/0000:00:1f.2/ata2/host1/target1:0:0/1:0:0:0/block/sda' is taking a long time
Mar 30 16:14:22 ns1 systemd[1]: systemd-udevd.service: Got notification message from PID 539 (WATCHDOG=1)
Mar 30 16:14:50 ns1 systemd[1]: dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4c94\x2d8560\x2d5d426e4.device: Job dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4
Mar 30 16:14:50 ns1 systemd-journald[501]: Forwarding to syslog missed 70 messages.
Mar 30 16:14:50 ns1 systemd[1]: dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4c94\x2d8560\x2d5d426e4.device: Job dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4
Mar 30 16:14:50 ns1 systemd[1]: Timed out waiting for device dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4c94\x2d8560\x2d5d426e4.device.
Mar 30 16:14:50 ns1 systemd[1]: boot.mount: Job boot.mount/start finished, result=dependency
Mar 30 16:14:50 ns1 systemd[1]: Dependency failed for /boot.

此时交换区和 LVM 已安装完毕。进入紧急模式,按 Control-D 继续启动,然后一切正常。

如果我 tar /boot 下的所有文件,umount /boot 和 /boot/efi,然后解压它们,更改 fstab,更新 initramfs,并在没有这些分区的情况下重新启动,则节点将启动。

我注意到,在进入紧急模式之前,即使 lvm 已成功挂载,也不会出现显示 /dev/sda 已插入的日志。按下 control-D 继续启动后,日志会出现,包括 sda2 在内的所有内容都可以正常挂载。

Mar 30 16:15:33 ns1 systemd[1]: dev-sda.device: Changed dead -> plugged

任何帮助都非常感谢。

答案1

经过大量搜索后,我打开了 /etc/udev/udev.conf 中非常方便的调试日志,并更新了我的 initramfs。

$ cat /etc/udev/udev.conf 
# see udev.conf(5) for details
#
# udevd is started in the initramfs, so when this file is modified the
# initramfs should be rebuilt.

#udev_log="info"
#event_timeout=300
udev_log="debug"

这帮助我识别了问题。启动初期发生了数千次“curl”,这些事件来自 udev 规则,该规则用于添加和删除“sd*”设备。我注释掉了这些规则操作,现在系统启动了!可以使用 journalctl -b 查看日志。

相关内容