我在 VMWare ESXi 6.5 上安装了一些 Ubuntu 18.04.1 虚拟机,它们都有 3 个核心、3GB 内存,连接到 SAS 存储阵列。
服务器nginx 1.14.0
作为 3-5 个 vhosts 的反向代理运行。ufw
允许从 LAN IP 进行 SSH 以及从其余 IP 进行 http/https。
当我关闭时ufw
,服务器会随机地让一个核心处于 100% 状态,控制台上会变得无响应,但也不会再响应 Web 请求。ufw
启用时有时也会发生这种情况,但频率要低得多。
服务器发生这种情况会怎样?如何避免再次发生这种情况?
输出iptables-save
答案1
该问题似乎是VMWare ESXi 6.5.0
与驱动程序结合的一个已知错误VMXNET3
。
下列的VMWare KB2151480解决了这个问题。
答案2
在此期间,哪些进程占用了最多的 CPU?在此期间,您是否在 syslog 或 dmesg 中看到任何内容?您可以尝试安装 atop,然后在发生这种情况后返回查看 atop 日志,以查看哪些进程正在占用 CPU。在这些虚拟机失去响应之前,vsphere web 客户端中的网络流量是什么样的?这可能是 syn-flood 或类似的东西,但 ufw 也可能是这里的一个干扰因素。