如果可用内存远超过pages_high水位线，kswapd可以激活吗？

Question 1

我能够找到至少一种可能导致在可用内存远高于任何区域水位线的情况下将页面交换出主内存的情况。该场景与区域压缩有关，这是虚拟机碎片整理的算法之一。

该过程背后的基本思想是移动页面以创建大的连续虚拟地址块。 “移动”是指更新页面的 PTE，而不是物理移动它们。

压缩算法从一个区域的两端运行两个扫描仪，相互靠近。一台扫描仪搜索要移动的页面，另一台扫描仪搜索可以移动到的空闲页面，最终它们应该在中间的某个地方相遇。

问题是，在区域压缩期间，可能会找到无法移动但可以回收的页面。当发生这种情况时，算法可能会尝试通过交换来回收它。

这里重要的是区域压缩不是由任何水印触发的。相反，每当高阶分配失败时，就会发生这种情况，即，如果内存碎片足够多，仍然有大量可用内存时，就会发生这种情况。

Answer

我能够找到至少一种可能导致在可用内存远高于任何区域水位线的情况下将页面交换出主内存的情况。该场景与区域压缩有关，这是虚拟机碎片整理的算法之一。

该过程背后的基本思想是移动页面以创建大的连续虚拟地址块。 “移动”是指更新页面的 PTE，而不是物理移动它们。

压缩算法从一个区域的两端运行两个扫描仪，相互靠近。一台扫描仪搜索要移动的页面，另一台扫描仪搜索可以移动到的空闲页面，最终它们应该在中间的某个地方相遇。

问题是，在区域压缩期间，可能会找到无法移动但可以回收的页面。当发生这种情况时，算法可能会尝试通过交换来回收它。

这里重要的是区域压缩不是由任何水印触发的。相反，每当高阶分配失败时，就会发生这种情况，即，如果内存碎片足够多，仍然有大量可用内存时，就会发生这种情况。

Question 2

我找到了另一个可能更合适的答案。事实证明，现代版本的 Linux 内核除了直接和定期回收之外，还具有慢速路径分配，其中 kswapd 在分配连续内存块失败后被唤醒。

当唤醒时，kswapd 会检查区域水印。然而，事实证明，水印并不是它们曾经是的静态区域级数字。相反，它们特定于分配顺序。

即，在决定是否应重新平衡区域时，kswapd 会考虑触发它的失败分配请求的顺序。因此，如果内存碎片足够多，kswapd 将有工作要做。

重新平衡区域时，kswapd 将在缩小文件缓存和从用户进程中窃取匿名页面之间进行选择（除非完全禁用交换）。所以剩下的问题是——为什么 kswapd 选择后一个选项。我认为答案再次是碎片——我认为回收算法可能有一种方法知道通过缩小文件缓存获得的页面可能在物理上不连续。

更一般地说，不仅最近版本的内核添加了内存碎片整理，而且页框回收和压缩内存之间的界限也有些模糊。

不幸的是，所有经典的 Linux 内核教科书都是基于 2.6 或更早的内核版本编写的，因此它们可能具有很大的误导性。