在 ZFS 池中检测到永久性错误

Question

这可能是由很多原因引起的。不管你相信与否，内存故障可能会导致这种情况（通过导致错误的校验和）。该文件可能来自之前已删除的数据集。您可能还有另一个发生故障的磁盘。您的 RAID 控制器可能损坏。

重新同步完成后，您绝对应该运行清理操作。

每个错误仅表明在给定时间点发生了错误。每个错误不一定仍然存在于系统中。正常情况下是这样的。某些临时中断可能会导致数据损坏，这些损坏会在中断结束后自动修复。池的完整清理保证检查池中的每个活动块，因此每当清理完成时都会重置错误日志。如果您确定错误不再存在，并且不想等待清理完成，请使用 zpool online 命令重置池中的所有错误。

https://docs.oracle.com/cd/E19253-01/819-5461/gbbwl/index.html

因此，如果错误在清理后消失，那么它们就是旧的并且不再活跃。如果它们持续存在，则说明存在需要注意的问题（可能是某种硬件故障）。
我的公司有大约 9000 台在 smartOS 上运行 ZFS 的服务器，我们很少看到这种情况，但如果不能通过更换故障磁盘/清理池来解决问题，我们通常最终会对机箱/RAID 控制器/主板等进行 RMA 处理。

Answer 1

这可能是由很多原因引起的。不管你相信与否，内存故障可能会导致这种情况（通过导致错误的校验和）。该文件可能来自之前已删除的数据集。您可能还有另一个发生故障的磁盘。您的 RAID 控制器可能损坏。

重新同步完成后，您绝对应该运行清理操作。

每个错误仅表明在给定时间点发生了错误。每个错误不一定仍然存在于系统中。正常情况下是这样的。某些临时中断可能会导致数据损坏，这些损坏会在中断结束后自动修复。池的完整清理保证检查池中的每个活动块，因此每当清理完成时都会重置错误日志。如果您确定错误不再存在，并且不想等待清理完成，请使用 zpool online 命令重置池中的所有错误。

https://docs.oracle.com/cd/E19253-01/819-5461/gbbwl/index.html

因此，如果错误在清理后消失，那么它们就是旧的并且不再活跃。如果它们持续存在，则说明存在需要注意的问题（可能是某种硬件故障）。
我的公司有大约 9000 台在 smartOS 上运行 ZFS 的服务器，我们很少看到这种情况，但如果不能通过更换故障磁盘/清理池来解决问题，我们通常最终会对机箱/RAID 控制器/主板等进行 RMA 处理。

在 ZFS 池中检测到永久性错误

答案1

相关内容