显示测试以结束,read failure
但总体结果为PASSED
。那么该硬盘的状态如何?
root@master:~# smartctl -i /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family: Western Digital RE4 (SATA 6Gb/s)
Device Model: WDC WD2000FYYZ-01UL1B1
Serial Number: WD-WMC1P0385424
LU WWN Device Id: 5 0014ee 0ae6ce8de
Firmware Version: 01.01K02
User Capacity: 2,000,398,934,016 bytes [2.00 TB]
Sector Size: 512 bytes logical/physical
Rotation Rate: 7200 rpm
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS (minor revision not indicated)
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Sat Nov 25 02:04:28 2017 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
root@master:~# smartctl -H /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
root@master:~# smartctl -l selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 90% 19675 69299
# 2 Short offline Completed: read failure 90% 19675 52526
# 3 Short offline Completed: read failure 90% 19675 52526
# 4 Short offline Completed without error 00% 5505 -
更新:
root@master:~/chef-usability# smartctl -A /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 1
3 Spin_Up_Time 0x0027 166 164 021 Pre-fail Always - 6658
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 17
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 074 073 000 Old_age Always - 19698
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 15
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 13
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 77
194 Temperature_Celsius 0x0022 122 107 000 Old_age Always - 28
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 6
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 6
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 13
答案1
您的日志显示,当您的硬盘总共运行了 5505 小时时,您进行了一次简短的在线测试,结果完全通过了。
但是,当您的硬盘总共运行了 19675 小时时,您进行的三次测试在读取了所有扇区的 10% 后都因遇到坏扇区而停止。前两次测试在 52526 处发现了这个坏扇区,然后它可能被重新分配,而最近的一次测试在 69299 处发现了第二个坏扇区。
剩下的 90% 中可能还存在更多坏道。
现在,预计硬盘的整个使用寿命期间会出现一些坏扇区(这就是硬盘可以重新分配它们的原因),但是对于您来说,坏扇区已经足够多了,因此我需要仔细查看所有 SMART 属性(smartctl -A
)来确定是否要继续使用该磁盘。
编辑
属性看起来不错(阅读指南:所有值都以 100 为标准,值越低越差),但我有点困惑,这Reallocated_Sector_Ct
是(原始)零。仅从属性来看,磁盘看起来很健康。接下来我要尝试的是尝试dd
使用指示的 LBA 读取两个标记扇区(到另一个硬盘上),如果可以读取,则将它们写回,如果无法读取,则将它们写回零(/dev/zero
)。然后看看短测试和/或扩展测试是否继续进行。
答案2
您有 6 个扇区等待重新映射。但是,只有在写入时才会重新映射它们。
因此,最简单的“解决方案”就是擦除磁盘,然后重新安装磁盘上的内容。
如果只有文件,则需要将它们移到其他地方。对于损坏的文件,此操作将失败。
如果您安装了软件(例如操作系统或应用程序),则您不必移走用户数据以外的所有内容。
smartctl
请使用 ,而不是只查看 的部分信息-a
。它还包括您提供的所有信息加错误日志。
答案3
我最近有一个硬盘没有通过 SMART 测试。它甚至没有显示为“通过”,而是显示“失败”。不过硬盘仍在工作,所以如果你的硬盘显示“通过”,那它肯定没问题