我很困惑。我有一个 EC2 t2.micro
(我知道,是微型的,但直到最近它还不错)实例,其中有 5 个 Kafka 消费者,根据 ,它们htop
一直使用 100% 的 CPU。这似乎得到了 Kafka 的证实,这表明我们存在滞后,因此消费者无法跟上。
但是,当我查看此实例的 CloudWatch 时CPUUtilisation
,我发现它从未超过 10%。它始终低于该值,这让我认为我要么选择了错误的指标,要么我应该知道在设置 CloudWatch 警报时应该使用某种因素……
更新
我检查了mpstat -P all
(按照建议这里),而现在看来,效果却与报道相反10年前:
20:45:07 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle
20:45:07 all 10,80 0,00 1,49 0,71 0,00 0,27 66,92 0,00 0,00 19,81
20:45:07 0 10,80 0,00 1,49 0,71 0,00 0,27 66,92 0,00 0,00 19,81
所以显然我最多可以使用 10% 的 CPU,但 CloudWatch 没有显示我的份额的使用情况,而是显示整个 CPU 的使用情况...