由于缺乏更好的术语,ESXi 服务器已“冻结”,可能的原因是什么?

由于缺乏更好的术语,ESXi 服务器已“冻结”,可能的原因是什么?

我们在主机托管中拥有几台 ESXi 服务器,这台服务器运行良好,直到几周前,它从镜像中丢失了一个驱动器并“停止”了所有磁盘访问。ESXi 机器仍然可以从 shell 和 vSphere Client 进行访问,我可以看到硬件监视器告诉我阵列丢失了一个驱动器,但无法与虚拟机交互。没有一个对关机做出响应,等等。因此,当 ESXi 服务器本身无法重新启动时,我让主机托管的工作人员重新启动了服务器。一切正常,更换了驱动器并正确重建了阵列。一切都很好。

然后昨晚又发生了同样的“冻结”,只是这次没有驱动器故障。同样的故事,无法访问任何虚拟机,无法关闭它们,无法远程重新启动 ESXi 服务器,必须让 colo 员工对机器进行电源循环,然后才能正常重新启动。重新启动之前,ESXi 事件日志中没有任何内容,实际上没有任何迹象表明存在问题,除了所有虚拟机都无法访问(ESXi 认为它们正在运行并且运行正常。但性能图表都处于停滞状态)。

重启前后,硬件监视器均报告所有硬件完好无损(处理器、内存、存储、风扇、电源等)

有人见过这样的行为吗?

答案1

我曾经遇到过一次“冻结”,这是因为忘记了快照而导致空间不足。

相关内容