BTRFS 报告错误,但驱动器不报告错误。我的驱动器是否出现故障?

BTRFS 报告错误,但驱动器不报告错误。我的驱动器是否出现故障?

我已经使用 btrfs 一年多了,注意到日志中有很多错误的报告,但没有问题。最近的一次清理发现了大量的 csum 错误,我所说的巨大是指 8500 万个错误,但是清理修复了所有这些错误。 BTRFS 统计信息报告 2 个驱动器上存在大量写入和读取 io 错误(第三个驱动器上为零,我们处于 3 驱动器 raid 1 中。)

这看起来像是要求立即更换两个有错误的驱动器,但在任何其他日志中都没有任何错误的迹象,并且 smartctl 报告这些驱动器上的原始读取错误或重新分配的扇区为零,就像它们干净且快乐一样。

btrfs 中的错误太多,其他工具的错误为零(以及零问题)。这是什么原因造成的?当然,安全总比后悔好,但这需要 7 TB 的更换,而且可能没有任何原因。

[/dev/sde2].write_io_errs   556986
[/dev/sde2].read_io_errs    4
[/dev/sde2].flush_io_errs   278
[/dev/sde2].corruption_errs 85489893
[/dev/sde2].generation_errs 0
[/dev/sdd].write_io_errs   1814862
[/dev/sdd].read_io_errs    1280445
[/dev/sdd].flush_io_errs   5327
[/dev/sdd].corruption_errs 63
[/dev/sdd].generation_errs 119
[/dev/sda2].write_io_errs   0
[/dev/sda2].read_io_errs    0
[/dev/sda2].flush_io_errs   0
[/dev/sda2].corruption_errs 0
[/dev/sda2].generation_errs 0

来自 sde:

  1 Raw_Read_Error_Rate     PO-R--   100   100   016    -    0
  7 Seek_Error_Rate         PO-R--   100   100   067    -    0
198 Offline_Uncorrectable   ---R--   100   100   000    -    0
199 UDMA_CRC_Error_Count    -O-R--   200   200   000    -    0

来自 SDD

  1 Raw_Read_Error_Rate     POSR-K   200   200   051    -    0
  7 Seek_Error_Rate         -OSR-K   100   253   000    -    0
198 Offline_Uncorrectable   ----CK   200   200   000    -    0
199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    0
200 Multi_Zone_Error_Rate   ---R--   200   200   000    -    0

相关内容