我在 AWS 上的 Ubuntu 20.04 上运行 Apache 2 和 PHP 7.4.29 服务器,使用 AWS 负载均衡器和自动扩展组。这些服务器连接到其他 AWS 资源,例如 dynamodb、RDS (mysql)、memcache 等。这是一个稳定的生产环境,每分钟可正常执行 10K 次/次点击,运行完美。我们最近遇到了 X3 正常流量的峰值,服务器的响应时间开始变慢。
New Relic 仅显示这些事务的 PHP 时间较长,并未指向某一特定服务。
问题是,在给定的时间内,其中一些服务器的响应时间正常(~30 毫秒),而另一些服务器的响应时间较慢(~500 毫秒)。而且这种情况在服务器之间交替出现。因此,速度减慢似乎与外部服务(如 RDS)无关,因为所有服务器的服务都相同。我附上了在特定时间段处于活动状态的所有服务器的响应时间。什么会导致这种行为?
TLDR:我想问的是,当 PHP/Apache 服务器响应时间变慢的情况并非在所有服务器上同时发生(因此它不是外部共享服务)时,如何找出原因,而 New Relic 只是在交易中将其显示为 PHP 时间,而没有提供其他信息。