硬盘状况报告

硬盘状况报告

我是 Ubuntu 新手,我正在使用插入光驱轴的 HDD,有时会出现错误,社区认为这是 SATA 电缆和电源故障导致的错误。我使用 GSmart 控制工具扫描了我的 HDD,得到了以下输出:

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   119   099   006    Pre-fail  Always        -       202850112
  3 Spin_Up_Time            0x0023   100   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   099   099   000    Old_age   Always       -       1114
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002f   081   060   030    Pre-fail  Always       -       135948945
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       2779
 10 Spin_Retry_Count        0x0033   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       589
183 Runtime_Bad_Block       0x0032   019   019   000    Old_age   Always       -       81
 184 End-to-End_Error        0x0033   100   100   097    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   096   000    Old_age   Always       -       8590065937
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   060   057   045    Old_age   Always       -       40 (Min/Max 35/41)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       46
192 Power-Off_Retract_Count 0x0022   100   100   000    Old_age   Always       -       3
193 Load_Cycle_Count        0x0032   081   081   000    Old_age   Always       -       38019
194 Temperature_Celsius     0x0022   040   043   000    Old_age   Always       -       40 (0 17 0 0 0)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   199   000    Old_age   Always       -       312
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0

因为我是新手,如果有人能向我解释如何解释这个输出以及我应该做什么,我将非常感激。谢谢。

答案1

这是用于驱动器自我诊断的 SMART 数据。您可以找到有关如何解释它的很好的解释这里(也看看其他答案):

  • 值:这是控制器报告的原始值。通常这是一个容易理解的值(如通电时间或温度),但有时并非如此(如读取错误率)。不同的制造商可以使用不同的结构和含义来表示这些数据。
  • 标准化:这是上述值的标准化,因此值越高越好。因此,读取/错误率 114 优于 113。同样,硬盘如何将原始数据转换为标准化值取决于供应商。
  • 最差:您的驱动程序过去的最差标准化值(其中 99 可能是出厂设置)。
  • 阈值:当标准化值低于此值时,驱动程序可能会失败。

正如答案所述,归一化值应高于阈值,并且pre-fail报告中的所有属性似乎都满足此条件。对我来说唯一可疑的属性是End-to-End_Error其归一化值接近其阈值的属性。但根据

这是一个关键参数。该参数的下降可能预示着驱动器即将发生故障。建议紧急备份数据并更换硬件。

你不必担心 - End-to-End_Error 阈值故意设得很高,因为它似乎表明硬盘驱动器存在非常危险的问题 - 所有 End-to-End_Error 在我用了 6 个月的 WD Black 上,这些值与原来的完全一样,从来没有出现过任何问题。

我必须指出,重新旋转硬盘的问题在我使用两个不同的硬盘时发生过两次 - 这些硬盘现在工作正常,一个更换了 Molex 电缆,另一个更换了更好的外部机架 PSU - 所以这可能只是电源线或 PSU 的问题。

但以防万一,保存此 SMART 报告并在几周后重新运行诊断 - 只是为了检查是否有任何pre-fail标准化值下降 - 这可能表明比电源线问题更严重的问题。

此外,如果您可以在另一个 PSU 上测试驱动器,以确保它提供足够的电量,那就太好了 - 就我而言,外部机架没有在 12V 导轨上提供足够的电流,这导致 HDD 重新旋转。

相关内容