I/O 错误,但运行 badblocks 后一切又恢复正常:这怎么可能?

I/O 错误,但运行 badblocks 后一切又恢复正常:这怎么可能?

太长了;

硬盘似乎已损坏。无法格式化分区(mkfs.ext4I/O 错误),即使使用新创建的 GPT 表也是如此。 SMART 测试显示一些错误。我正想把光盘扔掉。在此之前,出于好奇,我进行了全面的badblocks测试。大惊喜:它没有检测到任何坏块!回到GParted,创建了一个GPT表+几个分区。现在一切正常!做了什么badblocks

完整的故事

我试图弄清楚刚刚发生的事情:我正打算扔掉 HDD,因为我无法在其上创建分区,并且 SMART 显示了一些错误。在扔掉磁盘之前,我只是想玩一下badblocks,然后...大惊喜:badblocks似乎已经修复了我的磁盘!我什至不知道它可以做到这一点!所以我现在很高兴,我确实可以使用我的磁盘,它工作正常,但我仍在试图弄清楚刚刚发生了什么!

这是我已经好几年没用过的 4TB 希捷硬盘了。我将其插入 SATA ↔ USB 适配器(适配器工作正常,我将它与其他几个 HDD 一起使用)。 Wirh GParted 我创建了一个新的 GPT 分区表,然后创建了一个分区。无法进行到底,出现mkfs.ext4I/O 错误:

(...)
Allocating group tables: done
Writing inode tables: done
Creating journal (131072 blocks): done
Writing superblocks and filesystem accounting information: 0/895
mke2fs 1.46.2 (28-Feb-2021)
mkfs.ext4: Input/output error while writing out and closing file system

我尝试了几次,使用不同的 USB 适配器、不同的 USB 电缆、不同的 USB 端口。从来没有工作过。

然后我做了一个 SMART 简短测试:

# smartctl -t short -C /dev/sde
(...)

# smartctl -a /dev/sde
(...)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short captive       Completed: read failure       90%       528         191105024
(...)

显然硬盘似乎有缺陷,对吧?所以我本来打算扔掉它,但badblocks之前做了一个测试:

# badblocks -wvs -t random -b 4096 /dev/sde
Checking for bad blocks in read-write mode
From block 0 to 976754645
Testing with random pattern: done                                                 
Reading and comparing: done                                                 
Pass completed, 0 bad blocks found. (0/0/0 errors)

测试持续了大约19个小时(4TB磁盘),没有出现任何错误。我很惊讶 !

回到GParted,创建了一个新的GPT表,一些分区,一切都很顺利。

我最终做了一些我习惯做的复制测试,以检查磁盘的性能,一切看起来都很正常(复制大文件时为 155MB/s R/W)。

还做了另一个 SMART 简短测试,completed without error这次是:

# smartctl -t short -C /dev/sde
(...)

# smartctl -a /dev/sde
(...)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short captive       Completed without error       00%       549         -
# 2  Short captive       Completed: read failure       90%       528         191105024
(...)

有人能理解吗?就好像运行badblocks以某种方式修复了我的硬盘一样。这怎么可能?甚至应该badblocks这样做吗?

注意:如果需要,可以提供更多信息(完整的 SMART 输出和完整的 GParted 结果)

答案1

是的,badblocks可以产生这种效果 - 并不是真正的设计使然,而是因为硬盘驱动器可以重新映射故障块,并且当它们在写入过程中遇到故障块时会这样做(因为没有数据可以丢失)。通过写入驱动器中的每个可访问扇区,badblocks为驱动器提供了充足的机会来执行此操作;如果驱动器的备用容量足以重新映射所有故障块,badblocks则不会发现任何问题。

如果您smartctl -a在驱动器上运行,您应该会看到它具有非零的“重新分配的扇区计数”(属性 5)。这表明它已重新映射扇区。

虽然驱动器现在可能工作正常,但这确实表明它有问题,因此应该怀疑它;如果部分存储发生故障,在不久的将来更多的存储可能会发生故障。

也可以看看SSD:“坏块”/“e2fsck -c”与重新分配/重新映射的扇区

相关内容