Linux 页面缓存减慢了具有 64GB RAM 的双 CPU 服务器上的 IO 速度

Question

您看到的行为是由于 Linux 在 NUMA 系统上分配内存的方式造成的。

我假设（但不知道）32GB 系统是非 Numa 的，或者 Numa 不足以让 Linux 关心。

如何处理 numa 的行为由选项决定/proc/sys/vm/zone_reclaim_mode。默认情况下，linux 将检测您是否正在使用 numa 系统，并在认为可以提供更好的性能时更改回收标志。

内存被分成多个区域，在 numa 系统中，第一个 CPU 插槽有一个区域，第二个 CPU 插槽有一个区域。它们显示为node0和node1。如果您 cat ，就可以看到它们/proc/buddyinfo。

当区域回收模式设置为 1 时，从第一个 CPU 插槽分配将导致在与该 CPU 关联的内存区域上进行回收，这是因为从本地 numa 节点回收在性能方面更高效。从这个意义上讲，回收是删除页面（例如清除缓存）或在该节点上交换内容。

如果将值设置为 0，则当区域已满时不会发生回收，而是将内存分配到外部 numa 区域。这样做的代价是另一个 CPU 短暂锁定以获得对该内存区域的独占访问权。

但随后它立即开始交换！几秒钟后：内存：总计 66004536k，已使用 65733796k，可用 270740k，缓冲区 34250384k 交换：总计 10239992k，已使用 1178820k，可用 9061172k，缓存 91388k

交换行为和何时交换取决于几个因素，其中一个因素是分配给应用程序的页面有多活跃。如果它们不太活跃，它们将被交换以支持缓存中更繁忙的工作。我假设虚拟机中的页面不会经常被激活。

Answer 1