ESXi 客户机性能缓慢影响整个主机

ESXi 客户机性能缓慢影响整个主机

我在配备 Intel E3-1220v3 CPU 的 Dell PowerEdge R220 服务器上运行 ESXi 5.5(内部版本 2068190)。它还安装了 16 GB 的 RAM 和 2 个 1TB SATA 磁盘,使用 Dell PERC H310 控制器以 RAID1 运行。

问题就在这里。几个小时前,我注意到一个客户机导致服务器上的 CPU 大幅飙升。峰值非常强烈,导致整个主机冻结,还影响了主机上的所有其他客户机。有问题的客户机只分配了 1 个核心,运行 Debian 7 x64。

请看下面所附的图片。

esxi cpu性能

图表左侧的延迟峰值大约每隔一分钟出现一次,持续大约一分钟。22:05 到 22:10 之间的较长暂停时间是我关闭客户机以确认它导致了 CPU 峰值。22:25 发生的事情是,我将客户机 CPU 限制为 2 GHz。这阻止了峰值的发生,但现在整个服务器运行非常缓慢。在 vSphere Client 中单击某些内容时,大约需要 5 秒钟才能打开一个新窗口。

发生这种情况之前我唯一做的事情就是更改 vSwitch 的名称,但我不知道这是否是导致这种情况的真正原因。我还对另一个客户机进行了一些更改,该客户机充当运行 vyos 的其他客户的网关,但我不明白这如何导致这种情况。

不,我无法访问手头的客户端,因为它属于客户。但是我知道它只运行 apache2、mysql 和 mailman。

我的问题是:

a) 有人知道是什么原因造成的吗或者我该怎么做才能找出原因?

b) 我没有想到一个客人能够以这种方式影响整个主持人和其他客人,这是应该的吗?

提前致谢,如果您需要更多信息,请告诉我。

编辑:经过调查,我们发现客户 VPS 已被入侵并被黑客用作 FTP 转储,这解释了流量巨大(几个小时内流量达 350 GB)。但是,这并不能解释为什么它会影响主机或其他客户机。我是否需要通过时钟频率而不是核心数量来限制 CPU 性能,以避免一个客户机影响其他客户机?或者可能是其他原因,例如 vSwitches(以及 ESXi)不知何故超负荷工作?

编辑 2:结果发现这不是 FTP 转储,而是他们让服务器参与了某种 DDoS 攻击。我们的 ISP 后来打电话给我们,说流量影响了他们的其他服务/客户,所以我猜流量相当大。

相关内容