Ceph 安装遇到高交换空间使用率

Question

要么添加 RAM，要么调整 OSD 以减少使用太多内存。

在/proc/meminfo32 GB 的系统上，内核正在跟踪 26 GB 的内存，其中有 1 GB 的页面（DirectMap1G）。其中 18 GB 是活跃的匿名页面。在阅读了一些有关 Ceph BlueStore 绕过内核文件系统的内容后，这很有意义，因为它需要大量的匿名内存。而不是使用文件系统并让内核维护大型文件缓存。

没有提供 OSD 配置，但我可以猜测。~26 GB 内存除以 6 个 OSD，每个 OSD 略大于 4 GB。大约是默认的osd_memory_target4 GB。该指令的文档注意到实际上 (Linux) 内核可能会超过这个值，具体取决于它回收页面的积极程度。这暗示了虚拟内存系统存在一个难题：内核试图巧妙地偷懒回收内存，内存回收并不像人们想象的那么干净。

仅 Ceph 匿名页面的 24 GB 变化就使 32 GB 系统的利用率达到 75% 以上。这相当高。加上文件缓存和内核等其他分配，观察到页面调出也就不足为奇了。

令我惊讶的是，你把 RAM 增加了一倍，但问题仍然存在。大约 28 GB 的内存对我来说看起来像是 30 多 GB 的工作负载。除非 Ceph 自动缓存大小在增加时做了一些巧妙的事情（我不知道），Comitted_AS否则它不会在 60 GB 时分页。MemTotal

一个简单的办法是减少osd_memory_target，比如从 4 GB 减少到 3 GB。释放一些 GB，利用率可能就会低到足以避免因页面输出缓慢而导致的崩溃。

（其他 Ceph 缓存调整参数都有记录，但我对它们或您的系统了解不够，无法建议您尝试什么。）

Answer 1

要么添加 RAM，要么调整 OSD 以减少使用太多内存。