有人可以解释一下默认 munin 图表的“用例”吗？

Question

每个设备的磁盘 I/O 数（I/O/秒）

对于传统硬盘来说，这是一个非常重要的数字。I/O 操作是对磁盘的读取或写入操作。使用旋转主轴，您可以获得每秒数十到 200 IOPS 的速度，具体取决于磁盘速度及其使用模式。

这并不是全部：现代操作系统确实有 I/O 调度程序，它们会尝试将多个 I/O 请求合并为一个，从而加快处理速度。此外，RAID 控制器等也会执行一些智能 I/O 请求重新排序。

每个设备的磁盘延迟（平均 IO 等待时间）

从对单个磁盘执行 I/O 请求到实际从那里接收数据需要多长时间。如果这个时间在几毫秒左右，则表示一切正常；如果是几十毫秒，则表示磁盘子系统开始出汗；如果是几百毫秒以上，则表示问题很大，或者至少系统非常非常慢。

IO 服务时间

您的磁盘子系统（可能包含许多磁盘）的整体运行情况。

IOStat（块/秒读取/写入）

每秒读取/写入多少个磁盘块。查找峰值和平均值。如果平均值开始接近磁盘子系统的最大吞吐量，则是时候计划性能升级了。实际上，在此之前就做好计划。

可用熵（字节）

有些应用程序确实希望获得“真正的”随机数据。内核从多个来源收集“真正的”随机性，例如键盘和鼠标活动、许多主板上的随机数生成器，甚至视频/音乐文件（video-entropyd 和 audio-entropyd 可以做到这一点）。

如果您的系统耗尽了熵，那么需要该数据的应用程序就会停滞，直到它们获得数据为止。我个人过去曾亲眼目睹过 Cyrus IMAP 守护程序及其 POP3 服务出现这种情况；它在每次登录前生成一个很长的随机字符串，并且在一个非常快地消耗熵池的繁忙服务器上。

解决该问题的一种方法是切换应用程序以仅使用半随机数据（/dev/urandom），但这不再是本主题的一部分。

VMStat（正在运行/I/O 睡眠进程）

之前没有想过这个问题，但是我认为这可以告诉你每个进程的 I/O 统计信息，或者主要是它们是否正在运行某些 I/O，以及该 I/O 是否阻止 I/O 活动。

每个设备的磁盘吞吐量（读取/写入的字节数/秒）

这纯粹是字节每秒读取/写入，而且通常这是比人类可读的形式块，可能会有所不同。块大小可能会因使用的磁盘、使用的文件系统（及其设置）等而有所不同。有时块大小可能是 512 字节，有时是 4096 字节，有时是其他大小。

inode 表使用情况

对于具有动态 inode 的文件系统（例如 XFS），则什么都没有。对于具有静态 inode 映射的文件系统（例如 ext3），则一切都会好转。如果您拥有静态 inode、大型文件系统以及大量目录和小文件的组合，您可能会遇到无法在该分区上创建更多文件的情况，即使理论上会剩下大量可用空间。没有可用的 inode == 不好。

Answer 1