如何确定 vmware 虚拟主机服务中断的原因

如何确定 vmware 虚拟主机服务中断的原因

我正在尝试确定我的几台运行在 vmware esxi4 上的虚拟服务器不定期出现中断的原因。我有 12 台虚拟服务器分布在 2 台 esxi 主机上,我只注意到其中 3 台有此问题。有问题的虚拟服务器是一台 ftp 服务器和两台 dns 服务器。

发生中断时,我可以登录 vSphere 客户端并使用相关虚拟服务器的控制台,但在中断期间(持续时间从一分钟到近一小时不等),虚拟服务器似乎会遇到网络传输速度极慢(每秒 0-3 千比特)或根本没有连接的情况。(它们所在的数据中心有 100mb 的连接)

机器上的操作系统是 debian lenny,并且定期更新。

我还无法确定这些中断的原因,但它们确实开始困扰我,因此,如能提供任何有助于确定这些问题原因的帮助,我将不胜感激。

esxi 的日志文件仅包含

Feb 08 13:16:57.981: mks| SOCKET 8 (105) recv error 104: Connection reset by peer
Feb 08 13:16:57.981: mks| SOCKET 8 (105) destroying VNC backend on socket error: 1
Feb 08 13:16:57.998: mks| MKS: Base polling period is 1000000us
Feb 08 20:28:14.774: mks| MKS: Base polling period is 10000us
Feb 08 20:28:15.194: mks| VNCENCODE 9 encoding mode change: (720x400x16depth,16bpp,1440bytes/line)
Feb 08 20:28:15.228: mks| VNCENCODE 9 encoding mode change: (720x400x16depth,16bpp,1440bytes/line)

重复多次。这只是我连接和断开控制台吗?

答案1

以下是我要检查的内容:

  1. 将 ESXi 更新到最新版本 (4.1)
  2. 将客户机(VM)上的 VMtools 更新至最新版本。
  3. 关闭虚拟机 (守护进程) 上所有不需要的程序 - 显然任何服务器都应该这样做。
  4. 根据 VMware 的建议,验证您是否为每个 VM 分配了 1vCPU,除非您正在运行能够使用多个 CPU 的应用程序。
  5. 验证您没有过度投入内存等资源。
  6. 将虚拟机的 vmware 日志复制到您的电脑,通常位于数据存储中与虚拟机本身相同的目录中,并检查其中是否有奇怪的消息。

我假设您已验证主机与 VMware 兼容,否则 VMware 将不会为您提供支持。

相关内容