当我有千兆字节的可用内存时，顶部显示“swout”（交换）。为什么？

Question

我正在思考一个类似的问题——你看到了我关于 kswapd 和区域水印的帖子——我的例子（也可能在你的例子中）的答案是内存碎片。

当内存碎片足够多时，高阶分配将失败，这（取决于许多其他因素）将导致直接回收，或者将唤醒 kswapd，它将尝试进行区域回收/压缩。您可以在我的帖子中找到一些其他详细信息。

处理此类问题时可能被忽视的另一件事是记忆分区。即你可能有足够的内存全面的（它甚至可能包含足够的连续块）但它可能仅限于 DMA32（如果您使用 64 位架构）。有些人倾向于忽略 DMA32，认为它“小”（可能是因为他们习惯了 32 位思维），但 4GB 并不是真正的“小”。

您有两种方法可以确定您的案例中发生了什么。一是分析统计数据——您可以设置作业来定期拍摄 /proc/buddyinfo、/proc/zoneinfo、/proc/vmstat 等快照，并尝试理解您所看到的内容。

如果您让它工作，另一种方法会更直接和可靠：您需要捕获导致交换事件的代码路径，并且您可以使用内核检测的跟踪点来完成此操作（特别是，有许多 vmscan 事件）。

但让它发挥作用可能具有挑战性，因为低级仪器并不总是按照开箱即用的方式工作。就我而言，我们不得不花费一些时间来设置 ftrace 基础设施，最终却发现我们需要的 function_graph 探针由于某种原因无法工作。我们尝试的下一个工具是 perf，但第一次尝试也没有成功。但是，当您最终设法捕获感兴趣的事件时，它们可能会比任何全球计数器更快地引导您找到答案。

最好的问候，尼古拉

Answer 1

我正在思考一个类似的问题——你看到了我关于 kswapd 和区域水印的帖子——我的例子（也可能在你的例子中）的答案是内存碎片。