20.04 服务器在重启时挂起

20.04 服务器在重启时挂起

我在尝试重启或关闭家中的主存储服务器时遇到了问题。关闭过程会卸载并停止大部分系统,直到遇到systemd-udevd,然后系统就会挂起。

显示器上显示的内容如下:

...
[  OK  ] Reached target Unmount All Filesystems.
[  OK  ] Stopped Remount Root and Kernel File Systems.
[  OK  ] Reached target Shutdown.
[  OK  ] Reached target Final Step.
[  OK  ] Finished Reboot.
[  OK  ] Reached target Reboot.
[2706010.062757] systems-shutdown[1]: Waiting for process: systemd-udevd, systemd-udevd
[2706100.061724] systems-shutdown[1]: Waiting for process: systemd-udevd
[2706190.199550] shutdown[1]: Waiting for process: systemd-udevd
[2706280.198498] shutdown[1]: Waiting for process: systemd-udevd
[2706360.222337] sd-umoun[120154]: Failed to unmount /oldroot: Device or resource busy
[2706360.223343] sd-umoun[120155]: Failed to unmount /oldroot: Device or resource busy
[2706360.224401] sd-umoun[120156]: Failed to unmount /oldroot: Device or resource busy
[2706360.229444] shutdown[1]: Failed to finalize  file systems, ignoring

此时系统只是停留在那里,直到我物理地重新启动机器。

/var/log/syslog以下是绞刑发生时发生的事情的摘录:

May  6 07:33:22 ubuntu-store systemd[1]: Stopped Initialize hardware monitoring sensors.
May  6 07:33:22 ubuntu-store systemd[1]: Stopping LVM event activation on device 8:16...
May  6 07:33:22 ubuntu-store systemd[1]: Stopping LVM event activation on device 8:32...
May  6 07:33:22 ubuntu-store systemd[1]: Stopping LVM event activation on device 8:48...
May  6 07:33:22 ubuntu-store systemd[1]: Stopping LVM event activation on device 8:64...
May  6 07:33:22 ubuntu-store systemd[1]: Stopping LVM event activation on device 8:80...
May  6 07:33:22 ubuntu-store systemd[1]: Stopping Dispatcher daemon for systemd-networkd...
May  6 07:33:22 ubuntu-store systemd[1]: Stopping PackageKit Daemon...
May  6 07:33:22 ubuntu-store systemd[1]: Stopping Authorization Manager...
May  6 08:05:50 ubuntu-store systemd-sysctl[433]: Not setting net/ipv4/conf/all/promote_secondaries (explicit setting exists).
May  6 08:05:50 ubuntu-store systemd-sysctl[433]: Not setting net/ipv4/conf/default/promote_secondaries (explicit setting exists).

机器于 手动重启08:05:50

关于系统的一些信息:

  • Ubuntu Server 20.04 及其所有更新
  • 作为专用 Samba 服务器运行
  • 第五代英特尔酷睿 i5,配备 16GB RAM
  • 250GB SSD 启动盘
  • 25TB ZFS 存储池

lsb_release显示:

Distributor ID: Ubuntu
Description:    Ubuntu 20.04.2 LTS
Release:    20.04
Codename:   focal

同时uname -r显示:

5.4.0-72-generic

这个问题是最近才被发现的(大约上个月),因为除非有需要重新启动的安全更新,否则它不会经常关闭。我还没有追踪到的一个异常是负载不一致。CPU 利用率很少超过 4%。RAM 使用率很少超过 9GB。交换文件在使用时最多可能只有几十兆字节。然而,负载大约为 2.2。正在运行htopglances没有显示任何异常。不确定这是否是系统未识别的僵尸进程的证据。

正如人们所料,重启系统几天后一切恢复正常。然而,由于这是一台服务器,我并不赞成让机器每周日晚上自行重启,就像 90 年代的 Windows 桌面一样。

对于可能导致该问题的原因和/或如何解决该问题,您有什么想法吗?

答案1

我遇到了同样的问题。我必须完全重写 SD 卡上的 ubuntu 服务器,以便再次运行它。(我当时使用的是 raspberry pi 4 8​​gb RAM)。

在我重现错误后,我发现了一个名为可写的分区。我发现这个分区已经消失了,因为我重启了服务器。

作为临时修复,您可以重新创建该分区为可写,并选择分区系统为 ext4(linux 文件系统)。

相关内容