Cloudwatch 代理 CPU 使用率过高

Question

我有同样的问题，您已经为我解答了。我运行一个邮件服务器、一个 DNS 服务器和一个 Web 服务器（一个单独的 RDS 数据库实例的前端）。我曾经在一个 t2.nano 实例（不是 CPU 强机！）上运行所有这些，毫不费力（将 CPU 信用余额锁定在 72 而没有任何偏差）。

然后我将以下四行添加到每分钟运行一次的 cron 作业中（每行都有不同的指标名称）：

aws cloudwatch ... --value $(($(df --output=avail /     | tail -1)*1024))
aws cloudwatch ... --value $(($(df --output=avail /home | tail -1)*1024))
aws cloudwatch ... --value $(free -b | sed -r  's:Mem([^0-9]*([0-9]*)){6}.*:\2:p;d')
aws cloudwatch ... --value $(free -b | sed -r 's:Swap([^0-9]*([0-9]*)){2}.*:\2:p;d')

这导致我的 CPU 信用余额持续减少，所以我将 cron 间隔改为五分钟，这样就稳定了我的信用余额，没有明显进一步减少或增加。这太荒谬了！

最终的解决方案是什么？我认为是时候升级到 t3.nano 实例（两个 vCPU 而不是一个）了，我做到了。现在，替换的 cron 作业（见下文）每分钟运行一次，它以每小时 5 个的速度累积 CPU 积分。通过计算每分钟运行一次的第一个 cron 作业文件，可以得出每个 aws cloudwatch 语句每小时 0.4 个 CPU 积分的速率。

看来您可以在一个 aws cloudwatch 语句中组合发送多个指标，该语句与上面的一个语句同时执行：

{ cat <<EOF
[
 {
  "MetricName": "EC2 root",
  "Dimensions": [ { "Name": "Instance", "Value": "i-instance-id" } ],
  "Value":      $(($(df --output=avail /     | tail -1)*1024)),
  "Unit":       "Bytes"
 },
 {
  "MetricName": "EC2 home",
  "Dimensions": [ { "Name": "Instance", "Value": "i-instance-id" } ],
  "Value":      $(($(df --output=avail /home | tail -1)*1024)),
  "Unit":       "Bytes"
 },
 {
  "MetricName": "EC2 free",
  "Dimensions": [ { "Name": "Instance", "Value": "i-instance-id" } ],
  "Value":      $(free -b | sed -r  's:Mem([^0-9]*([0-9]*)){6}.*:\2:p;d'),
  "Unit":       "Bytes"
 },
 {
  "MetricName": "EC2 swap",
  "Dimensions": [ { "Name": "Instance", "Value": "i-instance-id" } ],
  "Value":      $(free -b | sed -r 's:Swap([^0-9]*([0-9]*)){2}.*:\2:p;d'),
  "Unit":       "Bytes"
 }
]
EOF
} | aws cloudwatch put-metric-data --namespace MySpace --metric-data file:///dev/stdin

[请注意，“heredoc”语法的使用允许在“文本”文件中评估表达式。]

谁知道 CloudWatch 代理在做什么。我来这里是想看看运行 CloudWatch 代理是否比使用单独的 aws cloudwatch 语句更有效。显然不是。

Answer 1