我的硬盘出现故障了吗?

我的硬盘出现故障了吗?

我刚刚尝试对我的硬盘进行测试,但它不想完成自检。结果如下:

smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       697
  3 Spin_Up_Time            0x0027   206   160   021    Pre-fail  Always       -       691
  4 Start_Stop_Count        0x0032   074   074   000    Old_age   Always       -       26734
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       28
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7432
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3186
191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       20473
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       84
193 Load_Cycle_Count        0x0032   051   051   000    Old_age   Always       -       447630
194 Temperature_Celsius     0x0022   113   099   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       16
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7432         92290592
# 2  Conveyance offline  Completed: read failure       90%      7432         92290596
# 3  Conveyance offline  Completed: read failure       90%      7432         92290592
# 4  Short offline       Completed: read failure       90%      7431         92290596
# 5  Extended offline    Completed: read failure       90%      7431         92290592

那么这个磁盘出现故障了吗?

答案1

您的驱动器非常乐意进行自检;从摘要来看,它在过去一小时内进行了五次以上的自检。在测试初期,所有自检都失败了,并出现了读取错误。

是的,这个硬盘出现故障。正如著名的 Google 实验室报告所说(尽管我现在找不到该报告的链接),如果smartctl报告说您的硬盘出现故障,那么很可能确实出现故障(我转述一下)。

编辑:不要尝试保存它。删除其中的所有数据,然后替换它。

答案2

回答你的问题,SMART 测试失败是硬盘即将发生故障的确切迹象。你应该备份数据并尽快更换硬盘,以防止潜在的数据丢失。

@sj0h 提到了加载周期数,这个数字非常高,达到 447,630。(大多数现代硬盘驱动器的设计可承受 600,000 次加载/卸载周期。)这通常是由高级电源管理 (APM) 功能引起的,该功能试图通过在空闲几秒钟后将磁头停放(从盘片上卸载)来节省电量。磁头会在需要时重新加载到盘片上。在大多数系统中,硬盘驱动器会间歇性地开启和关闭活动,这会导致发生大量加载/卸载周期。要关闭 APM,请在 root 提示符下运行以下命令:

smartctl -s apm,off /dev/sda

每次系统电源循环或进入睡眠状态或驱动器以其他方式关闭时都需要运行此命令,因为驱动器关闭时不会保留此设置。

根据我的经验,这样做将大大减少加载/卸载循环的次数,从而降低将来再次遇到此类故障的可能性。但请注意,这样做会增加功耗和驱动器温度。如果驱动器持续在超过 50 °C 的温度下运行,过早发生故障的风险就会增加,因此您可能希望在较温暖的月份保持 APM 开启(如果关闭,则将其打开)。

答案3

除了读取失败之外,还要考虑加载循环次数。接近 500,000 次的次数可能表明存在故障原因,或者至少是高负载循环磨损。每分钟通电时间都有一个加载循环。更换驱动器后,请确保新驱动器不会出现这种情况。

答案4

我个人会更换驱动器。如果您出于某种原因还不想这样做,但还想继续使用该驱动器一段时间,则需要采取某种方式来确保您不会意外地将坏区用于新文件。

我在一台旧 Mac 上有一个这样的驱动器,它只是用来录制视频,我决定暂时不想更换它,因为视频已经足够好了。所以我需要隔离错误。首先,我为坏文件创建了一个空文件夹,然后我尝试读取磁盘上所有现有文件,并将任何有错误的文件移动到坏文件目录中(希望只是不重要的文件)。

然后我创建了许多具有唯一名称的 1 MB 文件来填满硬盘(因此所有空白空间现在都位于这些 1 MB 文件中),然后重复该过程。所有包含错误的文件都被移至坏文件目录,而剩下的文件是好的,可以删除以回收坏空间。

现在,你可以将硬盘继续使用一段时间,但不要用它来做重要的事情。将要失败更多,并且一旦发生很可能会带来不便。

相关内容