我有一个自建的 FreeNAS 系统,它在一个 ZFS 池中使用 4 个 HDD 纯粹用于存储,在 ZFS 镜像中使用 2 个镜像的 16GB USB 内存条用于启动。它很稳定,已经运行了大约 8 个月。然而,隔夜电子邮件通常是这样的:
检查 zfs 池的状态: 名称 大小 分配 空闲 EXPANDSZ FRAG CAP DEDUP HEALTH ALTROOT freenas-boot 14.5G 1.67G 12.8G - - 11% 1.00x 在线 - volume1 7.25T 457G 6.80T - 2% 6% 1.00x 在线/mnt池:freenas-boot 状态: 在线 状态:一个或多个设备发生不可恢复的错误。 已尝试更正错误。应用程序不受影响。 操作:确定设备是否需要更换,并清除错误 使用“zpool clear”或用“zpool replace”替换设备。 看:http://illumos.org/msg/ZFS-8000-9P 扫描:scrub 于 2016 年 10 月 23 日(星期日) 03:51:22 在 0 小时 6 分钟内修复了 232K,没有错误 配置:
名称 状态 读写 CKSUM freenas-boot 在线 0 0 0 镜像-0 在线 0 0 0 gptid/253f05a3-be26-11e5-8d9c-d05099c04470 在线 0 0 1 gptid/879584e0-bfb0-11e5-ba20-d05099c04470 在线 0 0 9
错误:没有已知数据错误
校验和错误偶尔会增加,然后当我执行正常的 FreeNAS 更新时,所有内容都会再次重置为 0,然后该过程将重复,校验和错误会不时增加。
我没有看到任何迹象表明硬盘本身有任何故障,并且当我进行更改时,我将 FreeNAS 配置下载到外部备份位置,因此如果需要,我应该能够在新的闪存驱动器上重新安装。
综上所述,我应该对这些校验和错误有多担心呢?
答案1
可能的原因
这些错误可能有不同的来源,一些常见的包括:
- 连接不稳定或电缆损坏
- 突然断电或强行移除设备
- 如果使用有故障的非 ECC RAM,则会出现内存错误
您可以使用 清除错误zpool clear
,因为错误很少(而不是too many errors
),并且它们不会影响每个设备上的相同块。我怀疑 FreeNAS 升级也会这样做,因此会导致您描述的情况。
可能的解决方案
我会做以下事情:
- 运行 memtest86+ 一夜,排除内存故障
- 断开并重新连接所有电缆,检查是否有松动的连接,如有必要,请更换电缆(它们很便宜,因此简单地更换它们比故障排除更快)
- 如果你住在能源供应不稳定的地区,可以尝试使用 UPS 来改善供电状况(我读到过,在美国部分地区,电压下降是很常见的)。
- 使用其他 USB 端口/控制器或 PCIe 适配卡(相当便宜)测试 USB 端口/控制器是否有故障
- 尝试使用其他类型的 USB 记忆棒,我对基于 SLC 的 USB3 记忆棒的使用体验很好(只有校验和错误发生在移除或断电时)