如何远程排除启动错误?

如何远程排除启动错误?

我在 RHEL 环境中虚拟化了一个 Ubuntu 16.04 VM。我无法物理访问该服务器,只能通过 SSH 访问 Ubuntu 安装。

当我reboot向 Ubuntu VM 发出命令时,大约有三分之一的时间 VM 会在重启期间遇到错误,并启动到紧急 shell。发生这种情况时,我无法通过 SSH 连接到 VM,因此我必须向操作员发送电子邮件以硬重启 VM。

我需要确定导致此错误的原因。我的计划是重新启动虚拟机,直到它进入紧急 shell,然后让操作员获取任何有用的信息。他们可以访问处于紧急 shell 中的 Ubuntu 虚拟机、底层 RHEL 操作系统以及在 RHEL 中运行的虚拟化软件。此外,一旦虚拟机重新启动,我将能够检查 Ubuntu 系统中在紧急 shell/重新启动期间仍然存在的错误或日志文件。

我应该要求操作员获取哪些信息,以确定导致此问题的原因是什么?一旦 SSH 可用,我应该从 Ubuntu VM 本身获取哪些信息?

相关内容