FreeNAS 出现无法纠正的奇偶校验/CRC 错误

FreeNAS 出现无法纠正的奇偶校验/CRC 错误

在我的 FreeNAS 9.3 安装中,我收到越来越多的无法纠正的奇偶校验/CRC 错误(例如:

May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 b8 0e 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): Retrying command
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 68 10 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): Retrying command
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 18 12 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error

起初我更换了两个有这些问题的磁盘 - 但现在我最新的磁盘之一(在另一个端口上)也出现了这些问题。所以我确信这个驱动器完全没有问题。

什么原因会导致这些错误?我们的服务器中没有 ECC Ram...

SMART 日志中没有任何内容指出问题,所以我很困惑:

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0


SMART Error Log Version: 1                                
No Errors Logged

SMART Self-test log structure revision number 1           
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      2398         -

答案1

磁盘、控制器或电缆出现故障。

您没有提供此解决方案涉及的硬件的任何详细信息。这不是 RAM 问题,但请像其他故障排除工作一样处理此问题:

  • 这会影响多个磁盘。
  • 磁盘上的 SMART 报告没有显示任何错误......但是它们SATA 接口...
  • 调查磁盘是如何连接的?通过背板?通过组合扇出电缆?
  • 这听起来像是 SATA 设备。你换过电缆吗?
  • 您的控制器报告了什么?
  • 你是否谷歌错误字符串你收到了吗?

相关内容