服务器重新安装不起作用

服务器重新安装不起作用

我的 Ubuntu 服务器最近崩溃了,从那时起我就一直在努力恢复它。

服务器变得没有响应,ping 返回的结果不连贯,并且所有服务(SSH 或 Webmin)都无法连接。也无法关闭,所以我最终不得不将其关闭。

硬重置似乎破坏了根文件系统,因为启动文件夹和许多其他文件夹都是空的,这意味着我重启后进入了 grub 救援模式。

好吧,决定重新安装操作系统,我的旅程就从这里开始。

首先,什么是有效的:

  • 新安装没有问题
  • 找到所有驱动器,包括 RAID
  • 当在 USB 驱动器救援模式下打开 shell 时,我可以毫无问题地挂载所有驱动器(RAID 和备份驱动器)

设置是

  • SSD 用于操作系统、主目录和交换(3 个独立分区)
  • 3 个 4TB 硬盘,用于软件 raid 10(一个备用)
  • 单独的 2 TB 可交换驱动器,用于离线备份

这就是我被困住的地方:

  • 服务器启动、显示 grub 窗口并加载内核(许多常见的状态消息...)

  • 最后成功的消息似乎是

    开始:加载基本驱动程序...完成

    开始:运行脚本/init-premount...完成

    [19.000] 随机:快速初始化完成

    开始等待根文件系统

从那以后,下面有很多

Begin: Running scripts/local-block ... mdadm: no devices listed in config file were found
done

直到它最终放弃

Gave up waiting for root device. Common problems...
...
ALERT! UUID=.... does not exist. Dropping to shell 

此后系统冻结。

列出的 UUID 是正确的,代表我的 SSD 的启动分区。

这看起来好像突然间所有驱动器都无法访问,无论是启动驱动器(UUID 错误)还是 raid 阵列(mdadm 错误消息)

我尝试了 grup-updates 并重新安装,但都出现了奇怪的错误。但每当我从 USB 启动时,选择救援选项并打开带有 ssd-boot 分区的 shell,我都可以高兴地看到并安装所有分区。

我收到的一些群组消息:

grub-update

Found linux image....

Found initrd image....

WARNING: Failed to connect lvmdat. Falling back to device scanning
grup-probe: error: cannot find a GRUB drive for dev/sdb1 check your device map

我检查了 /etc/fstab,所有条目看起来都不错。UUID 与我预期的一致,/ SWAP 可用

有人知道下一步该去哪里吗?我的下一步是完全重新分区 SSD,但我想避免这种情况……

谢谢托马斯

相关内容