调整 ZFS 清理，以 141KB/s 的速度运行 15 天

Question 1

ZFS 清理操作遵循一些相当愚蠢的原则。最值得注意的是，它只在没有其他事情发生时才花时间进行清理。如果你经常用少量数据访问来戳一个池，清理实际上会让自己挨饿，几乎什么也不做。

可供探索的可调参数，以及我对其功能的简要说明（尽管我上次研究过这个问题已有一段时间了）：

zfs_scan_idle - 如果用户 I/O 发生在这么多时钟刻度内，则通过 zfs_scrub_delay 时钟刻度延迟清理 I/O
zfs_scrub_delay - 如果由 zfs_scan_idle 触发，则延迟清理操作多少个时钟滴答
zfs_top_maxinflight - 每个顶层 vdev 的最大清理 I/O 数量
zfs_scrub_limit - 每个叶子 vdev 的最大清理 I/O 数量
zfs_scan_min_time_ms - 每个 txg 在清理操作上花费的最小毫秒数
zfs_no_scrub_io - 无注释
zfs_no_scrub_prefetch - 没有注释，名称似乎暗示不会引起清理操作的预取

所有这些都可以使用“echo [tunable]/W0t[number]”随时更改，并使用“echo [tunable]/D”查看当前设置（我建议在更改之前这样做）。

因此，从理论上讲，在一般实践中，如果您要将 zfs_scan_idle 降至 10（或 1 - 或 0，如果它支持，则需要检查代码）并将 zfs_scrub_delay 降至 1（或 0，如果它支持），并且如果您的 txg_synctime_ms 设置是 5000 或更多，也许可以将 zfs_scan_min_time_ms 稍微调高一些，即使发生某种程度的用户 I/O，它也应该在实际执行清理操作方面变得更加积极。

在您的特定情况下，报告的 %b 和 asvc_t 暗示正在发生一些非常非常随机的读取工作负载（如果是真正连续的，旋转磁盘应该比这做得更好），并且您已经完成了上述“简单”的事情。因此，首先我会打开 zfs_no_scrub_prefetch，以禁用清理操作的预取，只是为了看看这是否有帮助。如果没有效果，则取决于您使用的 Nexenta 版本 - 您可能正在运行 30/5、5/1 或 10/5（这是我们用于 zfs_txg_timeout & (zfs_txg_synctime_ms*1000) 设置的简写）。将 zfs_txg_timeout 更改为 10，将 zfs_txg_synctime_ms 更改为 5000，然后尝试将 zfs_scan_min_time_ms 提高到 3000 或 4000。这会告诉 ZFS，与使用 5/1 作为默认值的旧 NexentaStor 安装中的默认设置相比，它可以在清理上花费更长的时间 - 但要小心，如果延迟设置也基本设置为 0，这可能会使正常 I/O 匮乏！

希望这有帮助，祝你好运！

Answer

ZFS 清理操作遵循一些相当愚蠢的原则。最值得注意的是，它只在没有其他事情发生时才花时间进行清理。如果你经常用少量数据访问来戳一个池，清理实际上会让自己挨饿，几乎什么也不做。

可供探索的可调参数，以及我对其功能的简要说明（尽管我上次研究过这个问题已有一段时间了）：

zfs_scan_idle - 如果用户 I/O 发生在这么多时钟刻度内，则通过 zfs_scrub_delay 时钟刻度延迟清理 I/O
zfs_scrub_delay - 如果由 zfs_scan_idle 触发，则延迟清理操作多少个时钟滴答
zfs_top_maxinflight - 每个顶层 vdev 的最大清理 I/O 数量
zfs_scrub_limit - 每个叶子 vdev 的最大清理 I/O 数量
zfs_scan_min_time_ms - 每个 txg 在清理操作上花费的最小毫秒数
zfs_no_scrub_io - 无注释
zfs_no_scrub_prefetch - 没有注释，名称似乎暗示不会引起清理操作的预取

所有这些都可以使用“echo [tunable]/W0t[number]”随时更改，并使用“echo [tunable]/D”查看当前设置（我建议在更改之前这样做）。

因此，从理论上讲，在一般实践中，如果您要将 zfs_scan_idle 降至 10（或 1 - 或 0，如果它支持，则需要检查代码）并将 zfs_scrub_delay 降至 1（或 0，如果它支持），并且如果您的 txg_synctime_ms 设置是 5000 或更多，也许可以将 zfs_scan_min_time_ms 稍微调高一些，即使发生某种程度的用户 I/O，它也应该在实际执行清理操作方面变得更加积极。

在您的特定情况下，报告的 %b 和 asvc_t 暗示正在发生一些非常非常随机的读取工作负载（如果是真正连续的，旋转磁盘应该比这做得更好），并且您已经完成了上述“简单”的事情。因此，首先我会打开 zfs_no_scrub_prefetch，以禁用清理操作的预取，只是为了看看这是否有帮助。如果没有效果，则取决于您使用的 Nexenta 版本 - 您可能正在运行 30/5、5/1 或 10/5（这是我们用于 zfs_txg_timeout & (zfs_txg_synctime_ms*1000) 设置的简写）。将 zfs_txg_timeout 更改为 10，将 zfs_txg_synctime_ms 更改为 5000，然后尝试将 zfs_scan_min_time_ms 提高到 3000 或 4000。这会告诉 ZFS，与使用 5/1 作为默认值的旧 NexentaStor 安装中的默认设置相比，它可以在清理上花费更长的时间 - 但要小心，如果延迟设置也基本设置为 0，这可能会使正常 I/O 匮乏！

希望这有帮助，祝你好运！

Question 2

我怀疑是硬件……

你为什么要让它运行 15 天？这不正常。停止清理 -zpool scrub -s tank然后检查系统。

您正在使用哪种控制器？
这是你第一次在这个泳池里运行清理程序吗？
是否存在一个问题促使您首先运行清理？

Answer

我怀疑是硬件……

你为什么要让它运行 15 天？这不正常。停止清理 -zpool scrub -s tank然后检查系统。

您正在使用哪种控制器？
这是你第一次在这个泳池里运行清理程序吗？
是否存在一个问题促使您首先运行清理？

Question 3

我的回答有点晚了，但如果其他人也遇到这种情况，我的看法是：只需尝试“dmesg”。就我而言，我没有执行清理，而是将文件复制到磁盘，我清楚地听到磁盘活动了几秒钟，然后全部停止了很长时间，然后再次工作等等。这是由于一个 SATA 控制器出现故障，dmesg 向我提供了所有错误。我起初以为是磁盘出现故障，但后来我意识到实际上是控制器出现故障。

Answer

我的回答有点晚了，但如果其他人也遇到这种情况，我的看法是：只需尝试“dmesg”。就我而言，我没有执行清理，而是将文件复制到磁盘，我清楚地听到磁盘活动了几秒钟，然后全部停止了很长时间，然后再次工作等等。这是由于一个 SATA 控制器出现故障，dmesg 向我提供了所有错误。我起初以为是磁盘出现故障，但后来我意识到实际上是控制器出现故障。

Question 4

清理使用可用的系统停机时间，即使在未加载的服务器上，也与可用性有关。内存和处理器是清理利用率的关键，而不是磁盘。可用的内存和处理器越多，清理性能就越好。但是，当然，在这种情况下，就 ZPools 而言，磁盘布局越好，清理性能也会越好。

因此，如果您的表现一直很慢，而且确实如此，我会将这些视为潜在原因。

Answer

清理使用可用的系统停机时间，即使在未加载的服务器上，也与可用性有关。内存和处理器是清理利用率的关键，而不是磁盘。可用的内存和处理器越多，清理性能就越好。但是，当然，在这种情况下，就 ZPools 而言，磁盘布局越好，清理性能也会越好。

因此，如果您的表现一直很慢，而且确实如此，我会将这些视为潜在原因。

调整 ZFS 清理，以 141KB/s 的速度运行 15 天

答案1

答案2

答案3

答案4

相关内容