如何诊断 FreeNAS 系统上反复出现的硬盘问题?

如何诊断 FreeNAS 系统上反复出现的硬盘问题?

我在家里设置了一个 FreeNAS(11.2-U8)服务器,其中包含 8 个驱动器,包括 2TB Seagate Barracuda ST2000DM006 驱动器,采用 RAID-Z2 配置。

系统其余硬件如下:

  • 中央处理器:英特尔(R) 酷睿(TM) i3-4170 CPU @ 3.70GHz
  • 电源: EVGA 100-W1-0500-KR
  • 母板:ASRock C226(支持 ECC)
  • 内存:NEMIX 内存 16GB(2 x 8GB)DDR3-1066MHz PC3-8500(ECC)

该设置已运行 2.5 年,没有出现问题,之后我开始在连接到端口 ADA7 的硬盘上遇到 SATA 错误。在我看来,2.5 年还很短,所以我决定用保修期更长的“NAS 级”硬盘来更换该硬盘,因此我购买了 WD Red Pro WD2002FFSX。

成功重新同步池后,仅在运行几天后,我就开始收到与此新驱动器相同类型的 SATA 错误。

我开始怀疑电缆的问题,所以我将 SATA 电缆的一端从 ADA6 和 ADA7 上的驱动器切换,将有问题的驱动器连接到 ADA6 上。错误不断被标记,但现在是在 ADA6 上;排除了电缆损坏甚至主板端口出现问题的可能性。

将所有东西重新插到各自的端​​口后,我接着切换了 ADA6 和 ADA7 的电源线。ADA7 上仍然存在错误,这意味着电源线是干净的。

话虽如此,我的下一步调试是什么?我不是这方面的专家,似乎要么是我运气不好,有两个坏驱动器,要么是发生了其他事情,而我不知道是什么。

我收到的错误如下:

Device: /dev/ada7, ATA error count increased from 2960 to 2961
Device: /dev/ada7, not capable of SMART self-check
Pool main state is DEGRADED: One or more devices has experienced an unrecoverable error. An attempt was made to correct the error. Applications are unaffected.

我必须提一下,所有硬盘都具备 SMART 功能。有时 NAS 运行几天都没有问题,然后它开始反复向我发送电子邮件报告问题。这确实是偶发行为。

答案1

我认为这是一个软件问题。我无法准确指出,但在我的 NAS 上运行所有可能的更新(切换到最新更新版本 11.3 并运行所有池升级)似乎已解决问题。

自从我更新所有内容以来,我已经运行了近 2 个月,没有任何问题。

相关内容