我的 Ubuntu 服务器最近崩溃了,从那时起我就一直在努力恢复它。
服务器变得没有响应,ping 返回的结果不连贯,并且所有服务(SSH 或 Webmin)都无法连接。也无法关闭,所以我最终不得不将其关闭。
硬重置似乎破坏了根文件系统,因为启动文件夹和许多其他文件夹都是空的,这意味着我重启后进入了 grub 救援模式。
好吧,决定重新安装操作系统,我的旅程就从这里开始。
首先,什么是有效的:
- 新安装没有问题
- 找到所有驱动器,包括 RAID
- 当在 USB 驱动器救援模式下打开 shell 时,我可以毫无问题地挂载所有驱动器(RAID 和备份驱动器)
设置是
- SSD 用于操作系统、主目录和交换(3 个独立分区)
- 3 个 4TB 硬盘,用于软件 raid 10(一个备用)
- 单独的 2 TB 可交换驱动器,用于离线备份
这就是我被困住的地方:
服务器启动、显示 grub 窗口并加载内核(许多常见的状态消息...)
最后成功的消息似乎是
开始:加载基本驱动程序...完成
开始:运行脚本/init-premount...完成
[19.000] 随机:快速初始化完成
开始等待根文件系统
从那以后,下面有很多
Begin: Running scripts/local-block ... mdadm: no devices listed in config file were found
done
直到它最终放弃
Gave up waiting for root device. Common problems...
...
ALERT! UUID=.... does not exist. Dropping to shell
此后系统冻结。
列出的 UUID 是正确的,代表我的 SSD 的启动分区。
这看起来好像突然间所有驱动器都无法访问,无论是启动驱动器(UUID 错误)还是 raid 阵列(mdadm 错误消息)
我尝试了 grup-updates 并重新安装,但都出现了奇怪的错误。但每当我从 USB 启动时,选择救援选项并打开带有 ssd-boot 分区的 shell,我都可以高兴地看到并安装所有分区。
我收到的一些群组消息:
grub-update
Found linux image....
Found initrd image....
WARNING: Failed to connect lvmdat. Falling back to device scanning
grup-probe: error: cannot find a GRUB drive for dev/sdb1 check your device map
我检查了 /etc/fstab,所有条目看起来都不错。UUID 与我预期的一致,/ SWAP 可用
有人知道下一步该去哪里吗?我的下一步是完全重新分区 SSD,但我想避免这种情况……
谢谢托马斯