Linux:启动失败后远程救援系统

Linux:启动失败后远程救援系统

语境

我有两台远程 Linux 服务器。这种情况已经发生过两次:系统或内核更新后,系统不再响应/无法通过 ssh 访问(配置错误或磁盘故障,...)。我不得不前往该位置来救援服务器。当启动过程失败时,系统会进入紧急/救援 shell,需要在本地进行管理。

问题:

是否有一种方法或引导加载程序功能可以监视引导过程(即看门狗),如果系统在一段时间后卡住,则超时会触发系统重新启动,并使用具有网络功能、ssh 等的不同映像(存储在专用媒体上,即 USB 密钥)以便通过 ssh 进行管理?

谢谢

答案1

如果您买不起 KVM-over-IP 或 iLO/DRAC/ILOM 硬件,您可以在这些系统的串行端口上连接 raspberry pi。然后配置 grub 以使用串行作为控制台,例如 -https://wiki.archlinux.org/index.php/working_with_the_serial_console- 谷歌搜索您的发行版。除了管理 BIOS 和重新安装操作系统之外,您几乎可以远程执行任何操作。要使这些操作正常工作,您需要支持通过串行端口输出的特殊 MB。

相关内容