背景
我最近有一台通过 USB 外部底座连接的新 WD Red Pro,在运行 SMART 长测试时失败Completed: read failure
(故障点缺少 LBA)。该驱动器成功通过了badblocks
运行、SMART 短测试和磁盘上的加密数据填充(注:意识到坏块的缺点、谷歌 2015 年的 HDD 预故障论文、预填充随机数据的有限用处等……但习惯使然)。
值得注意的是,badblocks
先前的一次运行失败了(操作系统断开了设备连接dmesg
并badblocks
发出了误报),但随后的测试在每 45 秒轮询一次 4K 扇区的读取时没有错误。
问题
HDD 固件是否完全控制 SMART 自检的应用程序,以便操作系统/控制器/驱动程序/ USB 不会影响测试完成/测试结果?
当然,应用程序和 HDD 之间的链接smartctl
可能会影响报告 SMART 结果和访问属性的能力,但(据我有限的知识)它们不会影响实际测试。
虽然这不是发布的问题的一部分,但我试图弄清楚 USB 链路(或其他中间组件)中的故障是否会产生假阳性结果(以 SMART 自检失败的形式)。
其他
- 驱动器显示无
reallocated_sector_ct
或offline_uncorrectable
计数 - 在一次失败的长时间自检之后,SMART 报告了几次
raw_read_error_rate
……但这些情况在驱动器断电后消失,并且 WORST 值没有从 的值移动100
(THRESH 为016
)——不确定 WD 如何使用此属性,但假设这意味着正常运行 - 推测传统观点是“只需 RMA 并获得另一个未出现任何故障的 HDD”……但更感兴趣的是了解 SMART 自检依赖关系(如果有)以及与 HDD 操作无关的潜在错误源。
编辑我不确定为什么这个问题被否决了,但如果有人能分享建设性的想法,我很乐意更新。
谢谢