快速评估 Linux 服务器负载以确定是否需要升级？

Question 1

仅根据正常运行时间数据无法确定，但如果您确实确定磁盘 io 不是瓶颈（通常是瓶颈），则该服务器的运行接近容量上限。我这样说是因为 LOAD/CPU COUNT 接近 1。实际上，这意味着大多数时候几乎有 1 个作业（每个 CPU）在等待资源。

我确实注意到，根据您的 TOP 输出，您的系统正在使用相当数量的 SWAP，因此我不确定您的系统受到 CPU 而不是内存/磁盘 IO 的限制。

Answer

仅根据正常运行时间数据无法确定，但如果您确实确定磁盘 io 不是瓶颈（通常是瓶颈），则该服务器的运行接近容量上限。我这样说是因为 LOAD/CPU COUNT 接近 1。实际上，这意味着大多数时候几乎有 1 个作业（每个 CPU）在等待资源。

我确实注意到，根据您的 TOP 输出，您的系统正在使用相当数量的 SWAP，因此我不确定您的系统受到 CPU 而不是内存/磁盘 IO 的限制。

Question 2

定义一个服务水平目标将有助于证明何时需要进行更改。无论您的基础设施如何，这都可以量化您的“没有遇到任何可见的滞后”断言。

也许您希望 99.9% 的页面加载时间低于 100 毫秒，以保持网站响应速度。您可能希望从客户端角度准确测量这一点，例如页面速度分析。

容量规划需要花点心思。该主机现在看起来有很多额外容量，但关键在于规划未来。

考虑任何计划中的组织增长或预期的负载峰值。了解系统的所有资源，例如USE 方法. 查找未达到服务水平目标的事件的根本原因，以及是否是容量问题。

制定增加容量的计划（如果需要）。了解如何扩展更多实例或扩大实例规模。在需要性能之前安装负载平衡器，并获得高可用性。

一般而言，具有剩余容量的 UNIX/Linux 系统的主机级别指标包括：