优化 ext4 以实现始终完整运行

Question 1

原则上，我不明白为什么严格的环形缓冲区写入会对碎片造成任何挑战。看起来似乎很简单。在我看来，这句话是基于更一般的写入工作负载的建议。但是看看链接的问题，我发现你有一个真正的问题......

既然你关心碎片，你应该考虑如何衡量它！ e4defrag存在。它只有两个选择。 -c只显示当前状态，不进行碎片整理。 -v显示每个文件的统计信息。所有选项组合均有效（包括无选项）。尽管它没有提供任何明确的方法来限制对正在运行的系统的性能影响，但e4defrag支持在单个文件上运行，因此您可以自己对其进行速率限制。

（XFS也有一个碎片整理工具，虽然我没用过。）

e2freefrag可以显示可用空间碎片。如果如果您使用 CFQ IO 调度程序，那么您可以使用降低 IO 优先级来运行它ionice。

引用的猜测是错误的，斯蒂芬·基特的回答是正确的。 ext4 不执行任何自动碎片整理。它不会尝试“洗牌”已写入的数据。

放弃这种奇怪的误解就没有理由建议“ext2/ext3”。除此之外，当前内核中不存在 ext3 代码。 ext4代码用于挂载ext3。 ext3 是 ext4 的子集。特别是当您创建相对较大的文件时，不使用范围似乎很愚蠢，而这些是 ext4 特有的功能。

我相信“悬挂”更多时候与日记联系在一起。请参阅（正在进行的文件系统）的评论bcachefs-

尾部延迟多年来一直是 ext4 用户的祸根 - 日志代码和其他地方的依赖性可能导致多线程工作负载上的简单操作（例如取消链接）出现 30 秒以上的延迟。似乎没有人知道如何修复它们。

在 bcachefs 中，线程在 IO 上阻塞的唯一原因是它明确要求（未缓存的读取或 fsync 操作），或资源耗尽 - 完全停止。在进行 IO 时，永远不会持有会阻塞前台操作的锁。虽然 bcachefs 目前还不是一个实时文件系统（它缺乏例如 IO 的实时调度），但很可能有一天它会成为一个实时文件系统。

不要让我解释使用XFS可以在多大程度上避免上述问题。我不知道。但如果您正在考虑测试替代文件系统设置，XFS 是我首先会尝试的。

我正在努力寻找有关在 ext4 上禁用日志记录的影响的大量信息。至少它似乎不是调整性能时考虑的常见选项之一。

我不确定你为什么使用 sys_sync()。通常最好避免（参见例如这里）。我不确定这是否真的解释了你的问题，但在试图缩小范围时遇到的事情似乎很不幸。

Answer

原则上，我不明白为什么严格的环形缓冲区写入会对碎片造成任何挑战。看起来似乎很简单。在我看来，这句话是基于更一般的写入工作负载的建议。但是看看链接的问题，我发现你有一个真正的问题......

既然你关心碎片，你应该考虑如何衡量它！ e4defrag存在。它只有两个选择。 -c只显示当前状态，不进行碎片整理。 -v显示每个文件的统计信息。所有选项组合均有效（包括无选项）。尽管它没有提供任何明确的方法来限制对正在运行的系统的性能影响，但e4defrag支持在单个文件上运行，因此您可以自己对其进行速率限制。

（XFS也有一个碎片整理工具，虽然我没用过。）

e2freefrag可以显示可用空间碎片。如果如果您使用 CFQ IO 调度程序，那么您可以使用降低 IO 优先级来运行它ionice。

引用的猜测是错误的，斯蒂芬·基特的回答是正确的。 ext4 不执行任何自动碎片整理。它不会尝试“洗牌”已写入的数据。

放弃这种奇怪的误解就没有理由建议“ext2/ext3”。除此之外，当前内核中不存在 ext3 代码。 ext4代码用于挂载ext3。 ext3 是 ext4 的子集。特别是当您创建相对较大的文件时，不使用范围似乎很愚蠢，而这些是 ext4 特有的功能。

我相信“悬挂”更多时候与日记联系在一起。请参阅（正在进行的文件系统）的评论bcachefs-

尾部延迟多年来一直是 ext4 用户的祸根 - 日志代码和其他地方的依赖性可能导致多线程工作负载上的简单操作（例如取消链接）出现 30 秒以上的延迟。似乎没有人知道如何修复它们。

在 bcachefs 中，线程在 IO 上阻塞的唯一原因是它明确要求（未缓存的读取或 fsync 操作），或资源耗尽 - 完全停止。在进行 IO 时，永远不会持有会阻塞前台操作的锁。虽然 bcachefs 目前还不是一个实时文件系统（它缺乏例如 IO 的实时调度），但很可能有一天它会成为一个实时文件系统。

不要让我解释使用XFS可以在多大程度上避免上述问题。我不知道。但如果您正在考虑测试替代文件系统设置，XFS 是我首先会尝试的。

我正在努力寻找有关在 ext4 上禁用日志记录的影响的大量信息。至少它似乎不是调整性能时考虑的常见选项之一。

我不确定你为什么使用 sys_sync()。通常最好避免（参见例如这里）。我不确定这是否真的解释了你的问题，但在试图缩小范围时遇到的事情似乎很不幸。

Question 2

这是另一种方法，但它有些复杂。

创建许多较小的分区，比如说 10 或 20 个。 LVM2在这种情况下可能会派上用场。然后以环形缓冲区的方式使用分区，如下所示：

其中一个分区始终是“活动”分区，新数据将被写入其中，直到完全填满或几乎填满为止。您无需留出任何净空。当活动分区已满或没有足够的可用空间来容纳下一个数据块时，切换到下一个分区，该分区随后将成为活动分区。

您的删除程序进程将始终确保至少有一个完全空的分区可用。如果没有——这是关键部分——它就会简单地重新格式化最旧的分区，创建一个全新的文件系统。这个新分区稍后将能够接收新数据，碎片最少甚至没有碎片。

Answer

这是另一种方法，但它有些复杂。

创建许多较小的分区，比如说 10 或 20 个。 LVM2在这种情况下可能会派上用场。然后以环形缓冲区的方式使用分区，如下所示：

其中一个分区始终是“活动”分区，新数据将被写入其中，直到完全填满或几乎填满为止。您无需留出任何净空。当活动分区已满或没有足够的可用空间来容纳下一个数据块时，切换到下一个分区，该分区随后将成为活动分区。

您的删除程序进程将始终确保至少有一个完全空的分区可用。如果没有——这是关键部分——它就会简单地重新格式化最旧的分区，创建一个全新的文件系统。这个新分区稍后将能够接收新数据，碎片最少甚至没有碎片。

Question 3

该问题几乎肯定是由 ext4 delalloc（延迟分配）默认 ext4 挂载选项引起的。它会导致延迟决定在何处写入新文件，直到同步（显式同步或定期运行的隐式同步）：如果文件系统已满，此操作可能涉及在磁盘上移动现有文件以为新文件创建连续空间。

您的问题可以通过在挂载选项中添加 nodelalloc 来解决：这将强制 ext4 在原始写入发生时创建空间（如果需要移动现有文件以腾出空间）。如果文件系统已满，它会减慢原始写入速度，并使其看起来无法使用缓冲区高速缓存进行写入，但这比延迟问题直到必须进行同步更好，因为数据会长时间滞留在文件系统中。如果断电，缓冲区高速缓存可能会丢失。

通常 delalloc 是更可取的，因为它只有在知道要写入的新文件的完整大小后才决定将文件放置在哪里，从而最大限度地减少碎片。然而，即使使用nodelalloc，ext4 也能很好地减少碎片，因为只要有可能，它就会尝试提前选择一个大的空间。

Answer

该问题几乎肯定是由 ext4 delalloc（延迟分配）默认 ext4 挂载选项引起的。它会导致延迟决定在何处写入新文件，直到同步（显式同步或定期运行的隐式同步）：如果文件系统已满，此操作可能涉及在磁盘上移动现有文件以为新文件创建连续空间。

您的问题可以通过在挂载选项中添加 nodelalloc 来解决：这将强制 ext4 在原始写入发生时创建空间（如果需要移动现有文件以腾出空间）。如果文件系统已满，它会减慢原始写入速度，并使其看起来无法使用缓冲区高速缓存进行写入，但这比延迟问题直到必须进行同步更好，因为数据会长时间滞留在文件系统中。如果断电，缓冲区高速缓存可能会丢失。

通常 delalloc 是更可取的，因为它只有在知道要写入的新文件的完整大小后才决定将文件放置在哪里，从而最大限度地减少碎片。然而，即使使用nodelalloc，ext4 也能很好地减少碎片，因为只要有可能，它就会尝试提前选择一个大的空间。

优化 ext4 以实现始终完整运行

答案1

答案2

答案3

相关内容