LSI raidcontroller 背后的 zfs 错误

Question 1

zfs scrub是“检查 zfs 错误的系统”。它将花费与读取卷中存储的所有数据相同的时间（按 txg 的顺序进行，因此它可能会进行大量搜索，具体取决于池的满载程度以及数据的写入方式）。一旦启动，zfs status将显示一些估计值。可以停止正在运行的 scrub。

如果您想要定期检查某些内容zpool status，最简单的方法是zpool status | grep -C 100 Status定期（每 6 小时一次）运行某些操作，并通过电子邮件发送输出（如果有）。您可能会找到您最喜欢的监控系统（如 nagios）的插件。或者自己编写也很简单。

仅热插拔驱动器不会触发重新同步。您必须运行zfs replace才能实现这一点。

您看到的读取错误也可能是某种控制器故障。即使它是企业硬件，这些（HW RAID）控制器有时也会表现异常。这些错误可能是由于命令耗时过长（控制器忙于处理其他事情）造成的。这就是为什么除非必要，我尽量远离这些错误。

我会检查驱动器上的 SMART 数据（参见man smartctl）并清理池。如果两者看起来都正常，请清除错误，不要弄乱您的池。因为如果池接近满，则在重新同步期间读取所有数据实际上可能会触发另一个错误。一旦您再次在同一驱动器上看到错误，就会开始恐慌 ;)。

顺便说一句，为了获得最佳性能，您应该在 RAIDZ2 vdevs 中使用 n^2+2 驱动器。

Answer

zfs scrub是“检查 zfs 错误的系统”。它将花费与读取卷中存储的所有数据相同的时间（按 txg 的顺序进行，因此它可能会进行大量搜索，具体取决于池的满载程度以及数据的写入方式）。一旦启动，zfs status将显示一些估计值。可以停止正在运行的 scrub。

如果您想要定期检查某些内容zpool status，最简单的方法是zpool status | grep -C 100 Status定期（每 6 小时一次）运行某些操作，并通过电子邮件发送输出（如果有）。您可能会找到您最喜欢的监控系统（如 nagios）的插件。或者自己编写也很简单。

仅热插拔驱动器不会触发重新同步。您必须运行zfs replace才能实现这一点。

您看到的读取错误也可能是某种控制器故障。即使它是企业硬件，这些（HW RAID）控制器有时也会表现异常。这些错误可能是由于命令耗时过长（控制器忙于处理其他事情）造成的。这就是为什么除非必要，我尽量远离这些错误。

我会检查驱动器上的 SMART 数据（参见man smartctl）并清理池。如果两者看起来都正常，请清除错误，不要弄乱您的池。因为如果池接近满，则在重新同步期间读取所有数据实际上可能会触发另一个错误。一旦您再次在同一驱动器上看到错误，就会开始恐慌 ;)。

顺便说一句，为了获得最佳性能，您应该在 RAIDZ2 vdevs 中使用 n^2+2 驱动器。

Question 2

在这种情况下，我会按照 ZFS 的要求去做。请运行清理。

我每周都会定期清理系统。我还使用观察者守护进程监视 Linux ZFS 安装的健康状况。

您的 ZFS 阵列可能未调整，因此有一些值可以帮助提高清理性能，但此时您应该运行它。

对于另一个问题，您的热插拔可能不会达到您预期的效果...请参阅下面的评论。

咆哮：

在硬件控制器后面拥有一堆 RAID-0 虚拟驱动器是一个坏主意！

您会遇到两种情况，但效果都不太好。可恢复性和错误检查能力有限。故障磁盘本质上是故障的虚拟驱动器，并且会产生热插拔影响。假设您移除了有问题的磁盘。您可能需要创建一个新的虚拟磁盘，否则可能会得到不同的驱动器枚举。

在某个时候，最好获得真正的 HBA 并将磁盘作为尝试直通设备（没有 RAID 元数据）运行，或者只需在受硬件阵列保护的 vdev 上运行 ZFS。例如，在控制器上运行 RAID-6 并在其上安装 ZFS。或者运行多个 RAID-X 组并让 ZFS 镜像或条带化生成的 vdev。

Answer