如果在 root 处于只读状态时 upstart 挂起,该如何调试?

如果在 root 处于只读状态时 upstart 挂起,该如何调试?

我正在尝试调试 14.04.2 LTS 上不成功/挂起的系统启动(upstart)。根是 luks 容器中的 ext4 文件系统。文件系统处于干净状态。

启动过程在 upstart-socket-bridge 之后停止(不一定在该特定服务之后,例如,当安装了 cups-daemon 时,它就在此之后停止)。init -v也不是很有帮助。唯一不是仅仅记录各种服务的启动/停止的日志条目是关于 init 之前 udev 的日志条目。

Begin: Running /scripts/init-bottom ... done.
udev exit failed --rc=2

(编辑)重新安装根 rw 最初似乎总是能够实现干净启动,但事实是,它有点不可预测,而且无论哪种方式我都曾启动失败和成功。怎么办?

观察:一切似乎都很好,系统只是没有重新挂载可写的根或继续启动。

问:我如何确定哪个服务导致了启动过程卡住?


initctl list更新:通过 getty 生成第二个 shell ,挂断后即可运行,以下是正在运行的作业

mountnfs-bootclean.sh start/running
udev start/running, process 438
upstart-udev-bridge start/running, process 432
plymouth start/running, process 122
resolvconf start/running
ssh start/running, process 767 <-- this one was manually started
mountall start/running, process 337
mountkernfs.sh start/running
mountnfs.sh start/running
bootmisc.sh start/running
upstart-socket-bridge start/running, process 745**
cryptdisks start/running
mountdevsubfs.sh start/running
mtab.sh start/running
network-interface (lo) start/running
network-interface (eth0) start/running
plymouth-ready (startup) start/running, process 315
plymouth-upstart-bridge start/running, process 316
mountall-bootclean.sh start/running
network-interface-security (network-interface/eth0) start/running
network-interface-security (network-interface/lo) start/running

更新 2:

  • 重新安装 upstart 和其所有依赖的数据包(很麻烦并且)没有效果。
  • 使用第二个控制台,我可以init 5使卡住的系统继续正常启动。
  • 即使我手动重新挂载 root rw(或使用 rw 内核参数),系统现在也会卡住 - 我最初观察到强制 root 可写可以解决这个问题,这是不正确的

解决方法:

似乎是ureadaheads 的错。清除它后,5 次启动都干净了,没有任何问题。我只是把这个问题(和额外的 100 个代表)留给任何感兴趣或知道原始问题答案的人:如果不是通过随机试验,我怎么能解决这个问题。

答案1

作为参考,我尝试过的(不成功的)调试步骤可能对其他人有用:

  • 获取另一个可以启动的类 debian 系统(例如可启动 USB 笔式驱动器上的实时 ubuntu),然后使用 chroot 对所检查的系统进行配置或软件更改。使用 qemu-static 可以在具有不同架构的系统上执行此操作。
  • 安装一个独立的shell,例如sash,然后更改内核命令行(使用grub中的e键或编辑grub.cfg / cmdline.txt)并添加init=/bin/sash,重新启动,检查该shell上的情况,然后才使用exec init继续启动
  • init与开关一起使用-v以增加日志记录
  • 尽早挂载可写的根文件系统(例如,在执行 init 之前,将“rw”添加到内核命令行mount -o remount,rw /)-这允许更多日志记录
  • 检查/var/log/upstart
  • 在执行 init 之前在 tty2 上启动一个额外的终端,例如getty -n -l /bin/bash 38400 tty2 &- 这有助于检查系统所处的状态(例如ps -Afiotop
  • 用于initctl list确定哪些服务处于哪种状态

相关内容