太长了;
硬盘似乎已损坏。无法格式化分区(mkfs.ext4
I/O 错误),即使使用新创建的 GPT 表也是如此。 SMART 测试显示一些错误。我正想把光盘扔掉。在此之前,出于好奇,我进行了全面的badblocks
测试。大惊喜:它没有检测到任何坏块!回到GParted,创建了一个GPT表+几个分区。现在一切正常!做了什么badblocks
?
完整的故事
我试图弄清楚刚刚发生的事情:我正打算扔掉 HDD,因为我无法在其上创建分区,并且 SMART 显示了一些错误。在扔掉磁盘之前,我只是想玩一下badblocks
,然后...大惊喜:badblocks
似乎已经修复了我的磁盘!我什至不知道它可以做到这一点!所以我现在很高兴,我确实可以使用我的磁盘,它工作正常,但我仍在试图弄清楚刚刚发生了什么!
这是我已经好几年没用过的 4TB 希捷硬盘了。我将其插入 SATA ↔ USB 适配器(适配器工作正常,我将它与其他几个 HDD 一起使用)。 Wirh GParted 我创建了一个新的 GPT 分区表,然后创建了一个分区。无法进行到底,出现mkfs.ext4
I/O 错误:
(...)
Allocating group tables: done
Writing inode tables: done
Creating journal (131072 blocks): done
Writing superblocks and filesystem accounting information: 0/895
mke2fs 1.46.2 (28-Feb-2021)
mkfs.ext4: Input/output error while writing out and closing file system
我尝试了几次,使用不同的 USB 适配器、不同的 USB 电缆、不同的 USB 端口。从来没有工作过。
然后我做了一个 SMART 简短测试:
# smartctl -t short -C /dev/sde
(...)
# smartctl -a /dev/sde
(...)
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short captive Completed: read failure 90% 528 191105024
(...)
显然硬盘似乎有缺陷,对吧?所以我本来打算扔掉它,但badblocks
之前做了一个测试:
# badblocks -wvs -t random -b 4096 /dev/sde
Checking for bad blocks in read-write mode
From block 0 to 976754645
Testing with random pattern: done
Reading and comparing: done
Pass completed, 0 bad blocks found. (0/0/0 errors)
测试持续了大约19个小时(4TB磁盘),没有出现任何错误。我很惊讶 !
回到GParted,创建了一个新的GPT表,一些分区,一切都很顺利。
我最终做了一些我习惯做的复制测试,以检查磁盘的性能,一切看起来都很正常(复制大文件时为 155MB/s R/W)。
还做了另一个 SMART 简短测试,completed without error
这次是:
# smartctl -t short -C /dev/sde
(...)
# smartctl -a /dev/sde
(...)
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short captive Completed without error 00% 549 -
# 2 Short captive Completed: read failure 90% 528 191105024
(...)
有人能理解吗?就好像运行badblocks
以某种方式修复了我的硬盘一样。这怎么可能?甚至应该badblocks
这样做吗?
注意:如果需要,可以提供更多信息(完整的 SMART 输出和完整的 GParted 结果)
答案1
是的,badblocks
可以产生这种效果 - 并不是真正的设计使然,而是因为硬盘驱动器可以重新映射故障块,并且当它们在写入过程中遇到故障块时会这样做(因为没有数据可以丢失)。通过写入驱动器中的每个可访问扇区,badblocks
为驱动器提供了充足的机会来执行此操作;如果驱动器的备用容量足以重新映射所有故障块,badblocks
则不会发现任何问题。
如果您smartctl -a
在驱动器上运行,您应该会看到它具有非零的“重新分配的扇区计数”(属性 5)。这表明它已重新映射扇区。
虽然驱动器现在可能工作正常,但这确实表明它有问题,因此应该怀疑它;如果部分存储发生故障,在不久的将来更多的存储可能会发生故障。