我正在尝试确定我的几台运行在 vmware esxi4 上的虚拟服务器不定期出现中断的原因。我有 12 台虚拟服务器分布在 2 台 esxi 主机上,我只注意到其中 3 台有此问题。有问题的虚拟服务器是一台 ftp 服务器和两台 dns 服务器。
发生中断时,我可以登录 vSphere 客户端并使用相关虚拟服务器的控制台,但在中断期间(持续时间从一分钟到近一小时不等),虚拟服务器似乎会遇到网络传输速度极慢(每秒 0-3 千比特)或根本没有连接的情况。(它们所在的数据中心有 100mb 的连接)
机器上的操作系统是 debian lenny,并且定期更新。
我还无法确定这些中断的原因,但它们确实开始困扰我,因此,如能提供任何有助于确定这些问题原因的帮助,我将不胜感激。
esxi 的日志文件仅包含
Feb 08 13:16:57.981: mks| SOCKET 8 (105) recv error 104: Connection reset by peer
Feb 08 13:16:57.981: mks| SOCKET 8 (105) destroying VNC backend on socket error: 1
Feb 08 13:16:57.998: mks| MKS: Base polling period is 1000000us
Feb 08 20:28:14.774: mks| MKS: Base polling period is 10000us
Feb 08 20:28:15.194: mks| VNCENCODE 9 encoding mode change: (720x400x16depth,16bpp,1440bytes/line)
Feb 08 20:28:15.228: mks| VNCENCODE 9 encoding mode change: (720x400x16depth,16bpp,1440bytes/line)
重复多次。这只是我连接和断开控制台吗?
答案1
以下是我要检查的内容:
- 将 ESXi 更新到最新版本 (4.1)
- 将客户机(VM)上的 VMtools 更新至最新版本。
- 关闭虚拟机 (守护进程) 上所有不需要的程序 - 显然任何服务器都应该这样做。
- 根据 VMware 的建议,验证您是否为每个 VM 分配了 1vCPU,除非您正在运行能够使用多个 CPU 的应用程序。
- 验证您没有过度投入内存等资源。
- 将虚拟机的 vmware 日志复制到您的电脑,通常位于数据存储中与虚拟机本身相同的目录中,并检查其中是否有奇怪的消息。
我假设您已验证主机与 VMware 兼容,否则 VMware 将不会为您提供支持。