我们许多从 16.04 升级到 18.04 的服务器都出现过这个问题。常见的配置是 root 是 LVM,并且有 /boot 分区,或者 /boot 和 /boot/efi 分区。例如:
$ lsblk -f
NAME FSTYPE LABEL UUID MOUNTPOINT
sda
├─sda1 vfat C45F-2000 /boot/efi
├─sda2 ext2 a906fd59-cb58-4c94-8560-5d426e4 /boot
└─sda3 LVM2_member 1P3Rxv-VZMx-gcs9-PlxM-DCI8-kIqr
├─node--007--vg-root ext4 316678d5-aaaf-43bd-bac6-cc3aeb1 /
├─node--007--vg-swap_1 swap 0724b0b0-9f2d-42aa-bbe2-7b8aa31 [SWAP]
├─node--007--vg--na ext4 7d42481b-f7fb-4ac6-9cf5-5df3ca17 /cache/na
├─node--007--vg-c ext4 e38d96f8-6afb-4d2c-94cc-28a02e90 /cache/c
└─node--007--vg-t ext4 44559b67-869e-4454-b792-792c1a16 /cache/d
使用内核调试日志时,我总是看到这种关于等待设备超时的日志
Mar 30 16:14:22 ns1 systemd-udevd[539]: seq 3206 '/devices/pci0000:00/0000:00:1f.2/ata2/host1/target1:0:0/1:0:0:0/block/sda' is taking a long time
Mar 30 16:14:22 ns1 systemd[1]: systemd-udevd.service: Got notification message from PID 539 (WATCHDOG=1)
Mar 30 16:14:50 ns1 systemd[1]: dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4c94\x2d8560\x2d5d426e4.device: Job dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4
Mar 30 16:14:50 ns1 systemd-journald[501]: Forwarding to syslog missed 70 messages.
Mar 30 16:14:50 ns1 systemd[1]: dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4c94\x2d8560\x2d5d426e4.device: Job dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4
Mar 30 16:14:50 ns1 systemd[1]: Timed out waiting for device dev-disk-by\x2duuid-a906fd59\x2dcb58\x2d4c94\x2d8560\x2d5d426e4.device.
Mar 30 16:14:50 ns1 systemd[1]: boot.mount: Job boot.mount/start finished, result=dependency
Mar 30 16:14:50 ns1 systemd[1]: Dependency failed for /boot.
此时交换区和 LVM 已安装完毕。进入紧急模式,按 Control-D 继续启动,然后一切正常。
如果我 tar /boot 下的所有文件,umount /boot 和 /boot/efi,然后解压它们,更改 fstab,更新 initramfs,并在没有这些分区的情况下重新启动,则节点将启动。
我注意到,在进入紧急模式之前,即使 lvm 已成功挂载,也不会出现显示 /dev/sda 已插入的日志。按下 control-D 继续启动后,日志会出现,包括 sda2 在内的所有内容都可以正常挂载。
Mar 30 16:15:33 ns1 systemd[1]: dev-sda.device: Changed dead -> plugged
任何帮助都非常感谢。
答案1
经过大量搜索后,我打开了 /etc/udev/udev.conf 中非常方便的调试日志,并更新了我的 initramfs。
$ cat /etc/udev/udev.conf
# see udev.conf(5) for details
#
# udevd is started in the initramfs, so when this file is modified the
# initramfs should be rebuilt.
#udev_log="info"
#event_timeout=300
udev_log="debug"
这帮助我识别了问题。启动初期发生了数千次“curl”,这些事件来自 udev 规则,该规则用于添加和删除“sd*”设备。我注释掉了这些规则操作,现在系统启动了!可以使用 journalctl -b 查看日志。