Linux Ubuntu 上负载平均怪异程度

Question 1

有趣的。

首先，您能否增加 sar 日志记录的频率。尝试每分钟记录一次，而不是每 10 分钟一次。sysstat cronjob 是可配置的。

接下来，尝试编写以下命令。

ps auxf > /tmp/ps.out
vmstat 1 50 > /tmp/vm.out
mpstat -P ALL 1 50 > /tmp/mp.out
iostat -xdk 1 50 > /tmp/io.out
cat /proc/meminfo > /tmp/meminfo.out

每次平均负载增加时，手动或通过 cron 收集这组数据。最好至少有一个完整工作日的数据。

现在，我明白了，服务器处于空闲状态，但仍有一些应用程序正在运行。它们是什么？

您是否可以运行一些分析工具，例如 perf 或 oprofile。

是否有任何服务器硬件组件发生改变？即使是固件升级或软件升级这样无害的事情。

嘿，有个问题。你运行的调度程序是什么。我相信它是 cfq，你能把它改成 noop 吗？输入elevator=noop内核命令行参数并重新启动系统，看看它是否会改善它。

Answer

有趣的。

首先，您能否增加 sar 日志记录的频率。尝试每分钟记录一次，而不是每 10 分钟一次。sysstat cronjob 是可配置的。

接下来，尝试编写以下命令。

ps auxf > /tmp/ps.out
vmstat 1 50 > /tmp/vm.out
mpstat -P ALL 1 50 > /tmp/mp.out
iostat -xdk 1 50 > /tmp/io.out
cat /proc/meminfo > /tmp/meminfo.out

每次平均负载增加时，手动或通过 cron 收集这组数据。最好至少有一个完整工作日的数据。

现在，我明白了，服务器处于空闲状态，但仍有一些应用程序正在运行。它们是什么？

您是否可以运行一些分析工具，例如 perf 或 oprofile。

是否有任何服务器硬件组件发生改变？即使是固件升级或软件升级这样无害的事情。

嘿，有个问题。你运行的调度程序是什么。我相信它是 cfq，你能把它改成 noop 吗？输入elevator=noop内核命令行参数并重新启动系统，看看它是否会改善它。

Question 2

日志顶部流程

由于发生的频率很高，因此设置 cron 任务来监控这些时间段内的顶级进程

#app01
20-59 0/2 * * * root /usr/bin/top -b -n 1 | /usr/bin/head -n 15 >> /var/log/top.log

更改20-59为*将记录每偶数小时的整小时。无论哪种情况，Cron 作业都会每分钟运行一次。

您可能需要将 top.log 文件添加到日志轮换中，这样如果您忘记禁用它，它就不会占用所有空间。

检查日志文件

高负载期间搜索日志文件条目

以下面的加载条目为例

10:25:01 PM         0       125      4.10      3.59      2.23         0

做

grep ' 22:2' /var/log/*
grep ' 22:2' /var/log/apache2/*

这将显示的所有日志条目22:2x:xx。可能必须包括其他日志目录。

2013 年 1 月 6 日星期日 21:00:07：xvda w_await 峰值

xvda 图表 - w_await 峰值出现在 2013 年 1 月 6 日星期日 21:00:07 在此处输入图片描述

Answer

日志顶部流程

由于发生的频率很高，因此设置 cron 任务来监控这些时间段内的顶级进程

#app01
20-59 0/2 * * * root /usr/bin/top -b -n 1 | /usr/bin/head -n 15 >> /var/log/top.log

更改20-59为*将记录每偶数小时的整小时。无论哪种情况，Cron 作业都会每分钟运行一次。

您可能需要将 top.log 文件添加到日志轮换中，这样如果您忘记禁用它，它就不会占用所有空间。

检查日志文件

高负载期间搜索日志文件条目

以下面的加载条目为例

10:25:01 PM         0       125      4.10      3.59      2.23         0

做

grep ' 22:2' /var/log/*
grep ' 22:2' /var/log/apache2/*

这将显示的所有日志条目22:2x:xx。可能必须包括其他日志目录。

2013 年 1 月 6 日星期日 21:00:07：xvda w_await 峰值

xvda 图表 - w_await 峰值出现在 2013 年 1 月 6 日星期日 21:00:07 在此处输入图片描述

Question 3

有一件事我肯定会检查：

vSphere 图表采用相同的模式，也许同一主机上的另一个 VM 正在占用 CPU（因此，由于 VM 可用的 CPU 时间较少，因此需要更多时间以恒定流量处理相同数量的数据，因此 VM 上的负载会增加）。

编辑：第一次没有得到它:)您正在 Rackspace 上运行，因此无法控制虚拟机管理程序，但可能值得询问 rackspace 是否可以检查这种模式是否在同一主机上的其他虚拟机上常见。

Answer

有一件事我肯定会检查：

vSphere 图表采用相同的模式，也许同一主机上的另一个 VM 正在占用 CPU（因此，由于 VM 可用的 CPU 时间较少，因此需要更多时间以恒定流量处理相同数量的数据，因此 VM 上的负载会增加）。

编辑：第一次没有得到它:)您正在 Rackspace 上运行，因此无法控制虚拟机管理程序，但可能值得询问 rackspace 是否可以检查这种模式是否在同一主机上的其他虚拟机上常见。

Linux Ubuntu 上负载平均怪异程度

答案1

答案2

日志顶部流程

检查日志文件

2013 年 1 月 6 日星期日 21:00:07：xvda w_await 峰值

答案3

相关内容