AIO fsync 可以提高 dpkg 性能吗？

Question

这个问题表明这对 ext4 或 XFS 没有帮助。

我还测试了安装一个更大的包 ( linux-image-4.9.0-9-amd64)。不管怎样，它似乎仍然需要同样的时间--force-unsafe-io。

外部2

在 ext2 上，--force-unsafe-io安装时间linux-image从 50 秒减少到 13 秒。

我运行测试的内核是5.0.17-200.fc29.x86_64，它使用CONFIG_EXT4_USE_FOR_EXT2.

我使用用户空间 aio_fsync() 实现测试了 ext2。然而，最好的改进并不依赖于使用 AIO fsync()。

我的进步实际上是由于副作用。我已将 dpkg 更改为首先执行所有 fsync() 操作，然后执行所有 rename() 操作。而未打补丁的 dpkg 在每次 fsync() 之后调用 rename()。我使用的 AIO 队列深度高达 256。队列深度为 1 的 AIO fsync() 明显慢于同步 fsync() - 似乎存在一些开销。最好的改进还需要SYNC_FILE_RANGE_WRITE首先完成所有原始操作。改进版本安装时间linux-image约为 18 秒。

这个操作顺序实际上是 Ted T'so 最初建议的:-D。发生的情况是CONFIG_EXT4_USE_FOR_EXT2， fsync() 也有助于同步父目录。您希望首先执行所有文件名操作，这样就可以避免每个目录进行多次磁盘更新。 CONFIG_EXT2我认为这对于旧的实现或普通的文件系统不会发生ext4。

ext4：这次让 fsync 同步无日志中的父目录

[...] 显然这也包括 ext2 默认模式。 [...]

https://elixir.bootlin.com/linux/v5.0.17/source/fs/ext4/fsync.c#L38

 * If we're not journaling and this is a just-created file, we have to
 * sync our parent directory (if it was freshly created) since
 * otherwise it will only be written by writeback, leaving a huge
 * window during which a crash may lose the file.  This may apply for
 * the parent directory's parent as well, and so on recursively, if
 * they are also freshly created.

和以前一样，用sync() 替换fsync() 阶段似乎提供了令人不安的良好性能，匹配--force-unsafe-io:-)。如果您可以使用它们，sync() 或syncfs() 似乎非常好。

BTFS

当我开始在 btrfs 上测试 aio_fsync() 时，我发现由于最近的数据完整性修复，fsync() 操作可能会导致文件的 rename() 阻塞。我决定我对 btrfs 不感兴趣。

为什么先调用 fsync() 时 rename() 需要更长的时间？

Answer 1

这个问题表明这对 ext4 或 XFS 没有帮助。

我还测试了安装一个更大的包 ( linux-image-4.9.0-9-amd64)。不管怎样，它似乎仍然需要同样的时间--force-unsafe-io。

外部2

在 ext2 上，--force-unsafe-io安装时间linux-image从 50 秒减少到 13 秒。

我运行测试的内核是5.0.17-200.fc29.x86_64，它使用CONFIG_EXT4_USE_FOR_EXT2.

我使用用户空间 aio_fsync() 实现测试了 ext2。然而，最好的改进并不依赖于使用 AIO fsync()。

我的进步实际上是由于副作用。我已将 dpkg 更改为首先执行所有 fsync() 操作，然后执行所有 rename() 操作。而未打补丁的 dpkg 在每次 fsync() 之后调用 rename()。我使用的 AIO 队列深度高达 256。队列深度为 1 的 AIO fsync() 明显慢于同步 fsync() - 似乎存在一些开销。最好的改进还需要SYNC_FILE_RANGE_WRITE首先完成所有原始操作。改进版本安装时间linux-image约为 18 秒。

这个操作顺序实际上是 Ted T'so 最初建议的:-D。发生的情况是CONFIG_EXT4_USE_FOR_EXT2， fsync() 也有助于同步父目录。您希望首先执行所有文件名操作，这样就可以避免每个目录进行多次磁盘更新。 CONFIG_EXT2我认为这对于旧的实现或普通的文件系统不会发生ext4。

ext4：这次让 fsync 同步无日志中的父目录

[...] 显然这也包括 ext2 默认模式。 [...]

https://elixir.bootlin.com/linux/v5.0.17/source/fs/ext4/fsync.c#L38

 * If we're not journaling and this is a just-created file, we have to
 * sync our parent directory (if it was freshly created) since
 * otherwise it will only be written by writeback, leaving a huge
 * window during which a crash may lose the file.  This may apply for
 * the parent directory's parent as well, and so on recursively, if
 * they are also freshly created.

和以前一样，用sync() 替换fsync() 阶段似乎提供了令人不安的良好性能，匹配--force-unsafe-io:-)。如果您可以使用它们，sync() 或syncfs() 似乎非常好。

BTFS

当我开始在 btrfs 上测试 aio_fsync() 时，我发现由于最近的数据完整性修复，fsync() 操作可能会导致文件的 rename() 阻塞。我决定我对 btrfs 不感兴趣。

为什么先调用 fsync() 时 rename() 需要更长的时间？

AIO fsync 可以提高 dpkg 性能吗？

答案1

外部2

BTFS

相关内容