Ubuntu 11.04 服务器因 Landscape-sysinfo CPU 过度消耗而挂起

Question 1

不久前，我找到了问题的真正原因，并认为我应该在这里记录下来，以便其他可能遇到类似问题的人可以参考。事实证明，问题的根本原因比我最初预想的更棘手、更复杂。

简而言之，run-parts它一直运行良好。它出问题只是另一个问题的征兆。故障链如下所示：

1）在完全不同的机器上（lsyncd基于的文件同步实用程序rsync）运行失常，原因超出了我们的关注范围。但我们担心的是，它lsyncd试图通过 SSH 与这个微实例（出现问题的地方）同步文件。

2) 因为lsyncd通过 SSH 同时建立了数十个连接，所以每个连接似乎都收到了landscape-sysinfo Ubuntu 默认提供的 SSH 登录横幅。这解释了什么landscape-sysinfo是 SSH 以及为什么它是 SSH 的子项。看起来这run-parts是罪魁祸首，但实际上问题是机器受到了 SSH 连接的轰炸。

3）由于这是 EC2 上的一个微实例，问题更加严重，我后来发现，亚马逊严重限制了 CPU 消耗稳定超过某个阈值的微实例。（有关细节的详细说明，请参阅Greg 的闲聊。非常感谢 Greg 撰写的这篇文章！)

因此，当机器受到 SSH 连接的轰炸时，它会运行很慢，然后变得无法使用节流阀启动后速度变慢。

谜团已揭开！

Answer

不久前，我找到了问题的真正原因，并认为我应该在这里记录下来，以便其他可能遇到类似问题的人可以参考。事实证明，问题的根本原因比我最初预想的更棘手、更复杂。

简而言之，run-parts它一直运行良好。它出问题只是另一个问题的征兆。故障链如下所示：