zpool status 报告错误...下一步怎么办?

zpool status 报告错误...下一步怎么办?

在我们的 FreeNAS 服务器上,zpool status给我:

  pool: raid2
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
    attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
    using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://www.sun.com/msg/ZFS-8000-9P
 scrub: none requested
config:

    NAME                                            STATE     READ WRITE CKSUM
    raid2                                           ONLINE       0     0     0
      raidz1                                        ONLINE       0     0     0
        gptid/5f3c0517-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/5fe33556-3ff2-11e2-9437-f46d049aaeca  ONLINE       3 1.13M     0
        gptid/60570005-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/60ebeaa5-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/61925b86-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0

errors: No known data errors

我该怎么办?scrub游泳池?

答案1

键入zpool clear raid2以清除错误并启动清理。

如果错误仍然存​​在,请更换磁盘。

有关硬件的更多详细信息会有所帮助,因此这是一般性建议。我对连接到 PC 主板的消费级磁盘组的建议与我对企业级设备的建议不同。

答案2

该工具会告诉您需要做什么:“确定设备是否需要更换“。

这些工具的智能程度有限,需要您(作为人工管理员)弄清楚一些事情。所需的步骤特定于您的硬件和设置,因此您需要根据对系统的了解做出一些决定。

查看命令的输出。看起来设备gptid/5fe33556-3ff2-11e2-9437-f46d049aaeca正在经历“写入”错误。“1.13M”的错误率非常高,我怀疑问题已经发生了一段时间而你却没有注意到。看看你是否能找出原因,然后更换磁盘。

如果您有硬件控制器,该控制器可能有额外的工具来帮助您确定故障的性质。

ZFS 可以处理损坏的扇区,因此无需惊慌。但也不要忽视这个问题。

作为预防措施,您还应该定期运行 ZFS 清理。请参阅http://doc.freenas.org/index.php/ZFS_Scrubs。当 ZFS 第一次遇到问题时,这将在您达到 1.13M 标记之前发出警报。

答案3

使用以下命令更改您的驱动器的 /dev/adaX。

[blackout@freenas ~]# smartctl -a /dev/ada0 | grep "Serial"
序列号:WD-WCC4EXXXXXXXX
也是一个有用的命令 [blackout@freenas ~]# glabel status

答案4

尽管这个问题很老了,但其他人可能会关注它。

zpool status如果是这样,请记住,和的输出zpool status -v与遇到的所有错误有关。这包括由于主板 SATA 端口(如果使用)、HBA 卡(如果使用)、SATA 电缆本身引起的错误.....而不仅仅是磁盘。

三个快速诊断测试是 - 使用快速检查磁盘smartctl,检查卡是否正确就位且没有松动,并尝试不同的端口或 SATA 电缆(电缆是读/写错误的常见原因)。

相关内容