为什么 Influxdb 的 Swap 使用率很高：磁盘 I/O 和 Swap 使用率为 100%，但内存只有 50%？

Question

你的内存不够。

操作系统将所有未使用的内存页都换出，并且交换活动为零（si/so列中vmstat），但内存和 IO 压力仍然很高。

在您的案例中，您不能依赖free输出，因为 InfluxDB 内存映射其数据，并且内存映射页面被视为Cached/Available而不是Used。在内存压力下，这些内存映射页面将被丢弃，InfluxDB 必须在需要时再次读回它们。

由于您的数据集为 409G，但只有 52G 可用于内存映射文件，因此您的活动数据集可能大于可用的 52GB，并且 InfluxDB 会进入类似于交换抖动的循环 - 它需要访问内存映射页面，但该页面不在内存中，因此它从磁盘读回，但同时丢弃另一个页面，因为它没有当前页面的内存，这保持了较高的读取 I/O。但这并不能解释当您没有任何查询时的高读取 I/O - 在这种情况下，您需要检查您是否真的有高读取 I/O。

如果我的猜测正确，您应该会看到InfluxDB 进程的输出Mapped中有一个很大的值/proc/meminfo，并且总值也很大。pmap

可能的缓解措施：

调整 InfluxDB 以尽可能减少其内存使用量
添加内存
添加交换并增加到vm.swappiness200 以避免丢弃内存映射页面，但要注意si/so列vmstat并将它们保持在零。

注意vm.swappiness。这是一个常见的误解，它vm.swappiness代表启动交换的已分配内存的百分比。每文档，它是“交换和文件系统分页的粗略相对 IO 成本，值介于 0 和 200 之间”。默认值为60意味着如果内核需要释放 200 个页面，它将从页面缓存池（Cachedin ）中丢弃 140 个文件页面，并从匿名页面池（ in ）free中换出 60 个页面。值为时，它将在池之间平等地丢弃/交换。如果页面不足或可用内存太低，则忽略这些比例。Usedfree100

PS 我对 InfluxDB 一无所知，因此这里将其视为黑匣子。这可能是 InfluxDB 内部的某些东西，迫使它读取所有数据。您可能在 InfluxDB 支持论坛上找到更好的答案，但当前配置下内存不足的事实仍然存在。

更新附加信息/proc/meminfo显示了我所期望的 - 59G 缓存中有 43G 映射内存。同时，它显示了大量非活动内存。

Inactive:       75364416 kB
Active(anon):   27646572 kB
Inactive(anon): 28055976 kB
Active(file):   23672076 kB
Inactive(file): 47308440 kB

28 GBInactive(anon)可能可交换。我会添加 5GB 的交换空间并检查它是否已填满 100%。如果已填满且没有显著的交换活动，si/so则再添加 5GB 的交换空间。如果它未填满 100%，则vm.swappiness在检查时增加到 100、150、200 si/so。虽然si/so保持接近零，但增加交换空间应该是一种安全的性能改进，因为它可以节省内存以用于更有用的页面缓存。

另一方面，47 GBInactive(file)看起来不太好。这意味着 2/3 的页面缓存大部分都丢失了，查询过于分散在整个 400GB 数据集上。通过增加交换来节省 10-20 GB 可能不会显著减少 I/O 负载，但仍然值得一试。

Answer 1