我已经使用 btrfs 一年多了,注意到日志中有很多错误的报告,但没有问题。最近的一次清理发现了大量的 csum 错误,我所说的巨大是指 8500 万个错误,但是清理修复了所有这些错误。 BTRFS 统计信息报告 2 个驱动器上存在大量写入和读取 io 错误(第三个驱动器上为零,我们处于 3 驱动器 raid 1 中。)
这看起来像是要求立即更换两个有错误的驱动器,但在任何其他日志中都没有任何错误的迹象,并且 smartctl 报告这些驱动器上的原始读取错误或重新分配的扇区为零,就像它们干净且快乐一样。
btrfs 中的错误太多,其他工具的错误为零(以及零问题)。这是什么原因造成的?当然,安全总比后悔好,但这需要 7 TB 的更换,而且可能没有任何原因。
[/dev/sde2].write_io_errs 556986
[/dev/sde2].read_io_errs 4
[/dev/sde2].flush_io_errs 278
[/dev/sde2].corruption_errs 85489893
[/dev/sde2].generation_errs 0
[/dev/sdd].write_io_errs 1814862
[/dev/sdd].read_io_errs 1280445
[/dev/sdd].flush_io_errs 5327
[/dev/sdd].corruption_errs 63
[/dev/sdd].generation_errs 119
[/dev/sda2].write_io_errs 0
[/dev/sda2].read_io_errs 0
[/dev/sda2].flush_io_errs 0
[/dev/sda2].corruption_errs 0
[/dev/sda2].generation_errs 0
来自 sde:
1 Raw_Read_Error_Rate PO-R-- 100 100 016 - 0
7 Seek_Error_Rate PO-R-- 100 100 067 - 0
198 Offline_Uncorrectable ---R-- 100 100 000 - 0
199 UDMA_CRC_Error_Count -O-R-- 200 200 000 - 0
来自 SDD
1 Raw_Read_Error_Rate POSR-K 200 200 051 - 0
7 Seek_Error_Rate -OSR-K 100 253 000 - 0
198 Offline_Uncorrectable ----CK 200 200 000 - 0
199 UDMA_CRC_Error_Count -O--CK 200 200 000 - 0
200 Multi_Zone_Error_Rate ---R-- 200 200 000 - 0