ext4:坏块已修复,但是这个磁盘快要死了吗?

ext4:坏块已修复,但是这个磁盘快要死了吗?

乌班图17.04; 4TB WD 绿色 SATA 上的 ext4 文件系统 [WDC WD40EZRX-22SPEB0]

挂载(启动时,从 fstab)因超级块损坏而失败。 fsck 报告 / inode 损坏,但已修复。 99% 的文件已恢复(丢失的少数文件可在备份中找到)。修复后的卷可以正常安装并运行。

看看SMART数据,我认为磁盘没关系。 “扩展”smartctl 测试通过。数据已经备份(并且不是关键任务)。我已经有一个替换驱动器。现在采取“零容忍”政策并更换磁盘是很诱人的,但由于它是一个价值 100 英镑的物品,我不想扔掉一个不稳定的磁盘并将每一个曾经写入过坏块的磁盘装箱。

这是 smartctl 转储。磁盘是否真的快要死了,还是只是发生了一次性事故?

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       61
  3 Spin_Up_Time            0x0027   195   176   021    Pre-fail  Always       -       7225
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       770
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -       12325
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       730
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       40
193 Load_Cycle_Count        0x0032   194   194   000    Old_age   Always       -       18613
194 Temperature_Celsius     0x0022   121   106   000    Old_age   Always       -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       21

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     12320         -
# 2  Short offline       Completed without error       00%     12311         -

答案1

根据 SMART 读数,磁盘目前看起来状况良好。

令人兴奋的磁盘扇区是这些

  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -    0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -    0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -    0

重新分配的扇区是写入失败并被重新映射到磁盘上其他位置的扇区。其中少量是可以接受的。零是极好的。

当前待处理扇区值是等待在其他地方重新分配的扇区数量。 (读取失败,但磁盘正在等待写入请求,这是重新映射扇区的点。)这可能会在一段时间内变为非零,并且随着扇区被覆盖,该数字将减少,并且重新分配的扇区计数将会增加。

离线不可纠正扇区的计数是发生故障且无法重新映射的扇区数。非零值是坏消息,因为它意味着您正在丢失数据。你的零值就很好了。

下一组显示磁盘驱动器的使用持续时间

  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -    770
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -    12325
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -    730

您的设备已运行 12325 小时(如果这是连续时间,则约为 18 个月),在此期间,它已启动和关闭 730 次。如果您每天关闭电源,那么您的磁盘在两年内每天运行大约 16 小时。

最后,每周安排一次完整的测试是值得的。您可以使用诸如 之类的命令来执行此操作smartctl -t full /dev/sda。测试中的错误可能会引起人们的关注。

# 1  Extended offline    Completed without error       00%     12320         -
# 2  Short offline       Completed without error       00%     12311         -

如果您在 NAS 中使用它,我会推荐 NAS 级磁盘。我个人认为WD Red在这方面非常好。成本稍高一些,但保修期较长。

相关内容