今天,当我使用 smartmontools 检查 SMART 属性时,我注意到我监控的一个 SATA HD 中的“Current_Pending_Sector”的 RAW_VALUE=1。以下是来自 smartctl.exe 的输出
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 192 181 021 Pre-fail Always - 5366
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 158
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000e 100 253 051 Old_age Always - 0
9 Power_On_Hours 0x0032 076 076 000 Old_age Always - 18234
10 Spin_Retry_Count 0x0012 100 100 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 153
194 Temperature_Celsius 0x0022 110 105 000 Old_age Always - 40
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0010 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 051 Old_age Offline - 0
考虑到这是 Windows 2008 服务器,处理此问题的最佳方法是什么?
现在 EventLog 中出现了以下消息:
smartd
2360
CRIT
Device: C:, 2 Currently unreadable (pending) sectors (changed +1)
Device: C:, ATA error count increased from 1 to 5
看起来驱动器正在慢慢损坏,我认为最好更换它。
答案1
关于非故障 SMART 消息基本上有两个阵营:
- 没什么大不了的,没有数据丢失,驱动器发现有几个扇区出了问题,并根据情况进行了处理。
- 没有新事物就是好消息;其他一切都是即将失败的征兆。
我个人总是运行 RAID,并定期监控备份到多个介质(现场和异地)。因此,我会忽略故障前的情况;我会一直使用它们,直到它们完全失效。