fio 3.23 在对许多小文件进行基准测试时发生核心转储

Question

（总结设置--alloc-size较大的数字有帮助）

我敢打赌，你可以简化这项工作，但仍然可以重现问题（这对任何看这个问题的人来说都是有帮助的，因为要看的地方更少了）。我猜关键在于opendir选项和您所说的目录包含“2^20 1MiB 文件”的事实......

如果你读过--alloc-size你会注意到它提到：

如果运行大型作业随机地图启用后，fio 可能会耗尽内存。

默认情况下，fio 会将随机 I/O 均匀地分布在文件中（每个块每次写入一次），但要做到这一点，它需要跟踪已写入的区域，这意味着它必须为每个文件保留一个数据结构。好的，您可以看到这是怎么回事...

为某些数据结构预留的内存池（因为它们必须在作业之间共享）。最初有 8 个池（https://github.com/axboe/fio/blob/fio-3.23/smalloc.c#L22），默认情况下每个池的大小为 16 MB（https://github.com/axboe/fio/blob/fio-3.23/smalloc.c#L21）。

每个执行随机 I/O 的文件都需要一个与之配合的数据结构。根据您的输出，我们猜测每个文件都会强制分配一个 368 字节 + 标头的数据结构（https://github.com/axboe/fio/blob/fio-3.23/smalloc.c#L434)，总计 388 字节。因为池在 32 字节的分配下工作（https://github.com/axboe/fio/blob/fio-3.23/smalloc.c#L70）这意味着我们实际上从每个文件的池中取出 13 个块（416 字节）。

出于好奇，我有以下问题：

您是在容器中运行它吗？
你的最大尺寸是多少/tmp？

我认为上述内容与您的问题无关，但可以很好地排除。

更新：默认情况下，docker 会限制 IPC 共享内存的数量（另见其--shm 大小选项）。目前尚不清楚这是否是此特定案例的一个因素，但请参阅下面的“原始作业仅在 8 个池处停止”评论。

那么为什么设置没有--alloc-size=776帮助？看看你写的内容，每个池的块没有增加似乎很奇怪，对吧？我注意到你的池已增长到最大值 16 (https://github.com/axboe/fio/blob/fio-3.23/smalloc.c#L24) 第二次。的文档--alloc-size说明了这一点：

--分配大小=千字节 分配额外的内部 smalloc 池大小千字节在基布. [...] 池大小默认为16MB.[强调]

您使用了--alloc-size=776... 776 KiB 不是小于 16 MiB 吗？这会使每个池都小于默认值，这也许可以解释为什么在第二次运行中它试图将池的数量增加到最大值 16，然后才放弃。

(2 ** 20 * 416) / 8 / 1024 = 53248 (but see the update below)

上述算法表明，如果您要创建 8 个池，总 RAM 约为 416 MB，则每个池的大小约为 52 MB。使用时会发生什么情况--alloc-size=53248？

更新：上面计算的数字太低了。在评论中，提问者报告称，使用更高的设置--alloc-size=1048576是必需的。

（不过，我有点担心原始工作只停止在 8 个池（128 MiB）处。这难道不表明尝试增长到第九个 16 MiB 池是有问题的吗？）

最后，fio 文档似乎暗示，当您要求特定的随机 I/O 分布时，这些数据结构将被分配。这表明，如果 I/O 是连续的，或者 I/O 使用随机偏移量但不必遵循分布，那么这些数据结构可能不必分配……如果您使用norandommap？

（另外：blocksize=2M但是您的文件有 1MiB 大 - 对吗？）

这个问题对于一个随意的 serverfault 回答来说太大太专业了，fio 项目本身可能会给出更好的答案（参见https://github.com/axboe/fio/blob/fio-3.23/REPORTING-BUGS，https://github.com/axboe/fio/blob/fio-3.23/README#L58）。

祝你好运！

Answer 1