我刚刚尝试对我的硬盘进行测试,但它不想完成自检。结果如下:
smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 697
3 Spin_Up_Time 0x0027 206 160 021 Pre-fail Always - 691
4 Start_Stop_Count 0x0032 074 074 000 Old_age Always - 26734
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 28
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 7432
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 097 097 000 Old_age Always - 3186
191 G-Sense_Error_Rate 0x0032 001 001 000 Old_age Always - 20473
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 84
193 Load_Cycle_Count 0x0032 051 051 000 Old_age Always - 447630
194 Temperature_Celsius 0x0022 113 099 000 Old_age Always - 34
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 16
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 90% 7432 92290592
# 2 Conveyance offline Completed: read failure 90% 7432 92290596
# 3 Conveyance offline Completed: read failure 90% 7432 92290592
# 4 Short offline Completed: read failure 90% 7431 92290596
# 5 Extended offline Completed: read failure 90% 7431 92290592
那么这个磁盘出现故障了吗?
答案1
您的驱动器非常乐意进行自检;从摘要来看,它在过去一小时内进行了五次以上的自检。在测试初期,所有自检都失败了,并出现了读取错误。
是的,这个硬盘出现故障。正如著名的 Google 实验室报告所说(尽管我现在找不到该报告的链接),如果smartctl
报告说您的硬盘出现故障,那么很可能确实出现故障(我转述一下)。
编辑:不要尝试保存它。删除其中的所有数据,然后替换它。
答案2
回答你的问题,SMART 测试失败是硬盘即将发生故障的确切迹象。你应该备份数据并尽快更换硬盘,以防止潜在的数据丢失。
@sj0h 提到了加载周期数,这个数字非常高,达到 447,630。(大多数现代硬盘驱动器的设计可承受 600,000 次加载/卸载周期。)这通常是由高级电源管理 (APM) 功能引起的,该功能试图通过在空闲几秒钟后将磁头停放(从盘片上卸载)来节省电量。磁头会在需要时重新加载到盘片上。在大多数系统中,硬盘驱动器会间歇性地开启和关闭活动,这会导致发生大量加载/卸载周期。要关闭 APM,请在 root 提示符下运行以下命令:
smartctl -s apm,off /dev/sda
每次系统电源循环或进入睡眠状态或驱动器以其他方式关闭时都需要运行此命令,因为驱动器关闭时不会保留此设置。
根据我的经验,这样做将大大减少加载/卸载循环的次数,从而降低将来再次遇到此类故障的可能性。但请注意,这样做会增加功耗和驱动器温度。如果驱动器持续在超过 50 °C 的温度下运行,过早发生故障的风险就会增加,因此您可能希望在较温暖的月份保持 APM 开启(如果关闭,则将其打开)。
答案3
除了读取失败之外,还要考虑加载循环次数。接近 500,000 次的次数可能表明存在故障原因,或者至少是高负载循环磨损。每分钟通电时间都有一个加载循环。更换驱动器后,请确保新驱动器不会出现这种情况。
答案4
我个人会更换驱动器。如果您出于某种原因还不想这样做,但还想继续使用该驱动器一段时间,则需要采取某种方式来确保您不会意外地将坏区用于新文件。
我在一台旧 Mac 上有一个这样的驱动器,它只是用来录制视频,我决定暂时不想更换它,因为视频已经足够好了。所以我需要隔离错误。首先,我为坏文件创建了一个空文件夹,然后我尝试读取磁盘上所有现有文件,并将任何有错误的文件移动到坏文件目录中(希望只是不重要的文件)。
然后我创建了许多具有唯一名称的 1 MB 文件来填满硬盘(因此所有空白空间现在都位于这些 1 MB 文件中),然后重复该过程。所有包含错误的文件都被移至坏文件目录,而剩下的文件是好的,可以删除以回收坏空间。
现在,你可以将硬盘继续使用一段时间,但不要用它来做重要的事情。将要失败更多,并且一旦发生很可能会带来不便。