我现在已经束手无策了,需要寻求帮助。
2 个物理 Web 服务器
CentOS NGINX PHP5 php-fpm
2 个物理数据库服务器
CentOS NGINX 弹性搜索 zookeeper couchbase
随着用户负载的增加和 php-fpm 池的填满,我开始收到 datadog 警报,提示网络连接正在断开。奇怪的是,我没有看到任何丢包。在用户负载增加期间,我遇到了从服务器到服务器、从服务器到外部、从外部到服务器的 WAN IP 的 ping 泛滥 - 并且在这些时间段内没有收到任何丢包
但是,当微中断期间负载较高时,通过 ssh 执行的命令(包括 ls 和 vim)响应较慢,但不会失败。我可以调出 htop,除了当时负载值高于正常值外,它没有显示任何其他内容。
我正在设置一个 zabbix 服务器来尝试捕获其中一些中断,但我想知道/希望其他人对如何捕获这些微中断有一些建议