“Bug:软锁定”-如何在没有物理访问的情况下重新启动/解决?

“Bug:软锁定”-如何在没有物理访问的情况下重新启动/解决?

我们小组的服务器(运行 Ubuntu 20.04.5 LTS)目前陷入了“BUG:软锁定”无休止的错误消息中(88 个 CPU 中有 2 个不满意)。

但是,我要问的不是错误/软锁定问题 - 我想知道是否有任何方法可以逃避错误消息/在无需物理访问的情况下重新启动服务器。我无法逃避错误消息来做任何事情(在最初几次出现错误消息时,我可以执行控制 C 来返回我的 bash 会话,但现在它也不起作用)。我无法从不同的终端窗口 ssh 进入服务器(它只是挂起),也无法通过 KVM 访问它(只是一个黑色窗口,它显示状态为“关闭”)。

我们无法物理访问我们的服务器 - 它被保存在一栋安全的建筑物中,如果断电并且我们的服务器关闭,我们必须通过电子邮件骚扰那里的工作人员以使其重新打开。他们今天都没有回复我,我非常想开始排除此问题,以便我们能够真正使用我们的计算资源。

我能做些什么来至少暂时摆脱那些无休止的错误信息“BUG:软锁定 - CPU#X 卡住了 22/23 秒”,以便我可以重新启动服务器?(仅供参考,我没有任何计算机背景;我只是(而且令人恐惧地)我们研究小组中计算机知识最丰富的成员,所以,呃,请注意这一点。)谢谢。

相关内容