过去几天我一直无法启动服务器,但我不知道原因。我怀疑是 CPU 出了问题,但希望得到一些建议来帮助我解决问题。
以下表示Ubuntu 22.04.2 LTS,但我从六个月前的一个问题中复制了此内容。我目前无法运行该命令。但是,我定期运行更新,因此服务器很可能Ubuntu 22.04.3 LTS。
$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 22.04.2 LTS
Release: 22.04
Codename: jammy
总结
服务器出现内核崩溃。重启后,我卡在以下屏幕:
服务器规格
Supermicro S8SAX 主板
中央处理器:Intel CORE i7 920
内存:16GB
冗余电源
历史
- 23 年 10 月 28 日星期六,我更换了 RAID 6 阵列中故障的硬盘。
- 在接下来的几个小时里,我偶尔会监控驱动器的重建情况。没有出现任何错误。
- 我运行
sudo nala update
并sudo nala upgrade
更新服务器。它表明将安装更新的内核。- 先前版本:
5.15.0-84-generic
- 新版本:
5.15.0-86-generic
- 先前版本:
- 升级后,服务器需要重启。我跑开
sudo reboot
了。 - 直到 2023 年 10 月 30 日星期一,我尝试通过 SSH 连接服务器,才再次查看该服务器。但我无法成功。
- 回到物理机器后,我看到以下屏幕,显示内核恐慌:
- 我强制关闭计算机并重新启动。我看到以下屏幕,其中启动停滞:
故障排除
- 我尝试启动旧内核:
5.15.0.86-generic
。无法启动。卡在同一屏幕上。 - 我尝试启动两个内核的恢复模式:
5.15.0-84-generic
&5.15.0-86-generic
。无法启动。卡在同一个屏幕上。 - 我尝试从 LIVE USB 启动 Ubuntu 22.04 和 Clonezilla。无法启动。卡在黑屏上。
- 我运行了 memtest+。没有出现任何错误。
昨天我无法在服务器上工作。今天,在周一关闭服务器之后,我启动了服务器,结果服务器真的启动了。
- 我运行了
sudo nala update
。sudo nala upgrade
它显示有可用的更新内核:5.15.0-88-generic
。我继续操作,它似乎成功了。但是,它没有显示需要重新启动。我还是重新启动了。 - 服务器重新启动,但 Grub 菜单未显示。进入控制台后,我运行它
uname -r
,它显示5.15.0-84-generic
- 我更新了 grub,再次显示菜单,超时时间为 5 秒。我重新启动了。
- Grub 菜单显示,但仅显示
5.15.0-84-generic
&5.15.0-86-generic
内核。我选择了第一个选项,但进程再次卡在了同一屏幕上Mountpoint-cache hash table entries
。 - 强制关闭电源并重新启动。
- Grub 菜单显示此时间,但超时现在是 24 秒(自行重置)。
- 但是...我又停留在同一个屏幕上
Mountpoint-cache hash table entries
。- 我无法启动任何内核。
- Grub 菜单不显示
5.15.0-88-generic
- Grub 菜单仍然只显示
5.15.0-84-generic
&5.15.0-86-generic
- 我无法继续进行下去。
结论
我怀疑这是硬件问题,很可能是 CPU 故障。但我不太确定,希望有人能提供更多有关如何解决此问题的信息。