Amazon Aurora 只读从属服务器的 CPU 使用率缓慢上升至 100% 并死亡

Amazon Aurora 只读从属服务器的 CPU 使用率缓慢上升至 100% 并死亡

我们有一个托管在AWS Aurora(mysql) 并有许多只读从服务器正在从中复制。主服务器和 4-12 个自动缩放从服务器目前db.r4.4xlarge尺寸和引擎版本:5.7.12。

每个从属服务器上线并运行几天,但在此期间,其 CPU 使用率会缓慢增加,直到每个从属服务器都必须单独关闭。一旦关闭,另一个服务器就会自动启动并继续运行。

以下是从属设备的性能图表: 在此处输入图片描述

正如您所看到的,晚上 11 点我们的仓库关闭,CPU 利用率下降,直到第二天才出现峰值并超过前一天。这种情况每天都在增加,直到达到 100%,然后必须关闭。

你们当中有人曾经见过这种模式吗?可以给我们提示一下问题可能出在哪里吗?

答案1

我建议启用Amazon RDS 性能见解获得关于可能消耗 CPU 的提示。

出现此类症状并且如果 SQL 流量没有线索,使用 Linux“perf”来识别消耗 CPU 的方法(只要二进制文件仍然有符号 - 即不是条带化的)会很有帮助,以确认它不是来自内部复制管理 - 但它不能与 RDS 实例一起使用。

相关内容