我目前正在试图弄清楚几周前购买的新硬盘是否有故障或者是否有 SATA 端口问题(如果可能的话)。
问题始于启动时,BIOS 屏幕显示 HD 出现 SMART 故障,我应该更换它。我开始从中复制文件,复制文件几分钟后(使用 rsync),复制开始失败,驱动器/文件将无法访问。我应该注意,整个驱动器分区都是使用 Veracrypt 安装的,因此文件将保持不可访问状态,直到我卸载 Veracrypt 中的分区并重新安装它,然后文件才可以再次访问。
同样的行为会重复发生,断开连接的情况变得更加频繁 - 我认为这仅仅是驱动器的恶化。
我对该驱动器运行了扩展的 SMART 测试,一切似乎都正常:
这让我怀疑问题是否真的出在硬盘上。我之前的两个磁盘也出现过故障(我相信是在同一个 HD 端口上,但它们至少已经使用了几年),并且表现出完全相同的行为 - 它们会给出 SMART 错误,工作了一点,但开始断开连接,最终根本无法安装。
我现在已经更换了 HD 使用的端口和电缆,到目前为止已经能够复制约 130GB 的数据。我将继续复制文件以查看它是否存在相同的问题,但有什么方法可以确保它不会再次出现故障并且问题出在 HD 上,因为如果驱动器有问题,我希望在退货期限内立即更换它。
更新:复制似乎很顺利。复制似乎很顺利,直到我尝试在文件资源管理器中浏览驱动器,它不会显示任何文件(并且在 bash 中执行“ls”出现“输入/输出错误”),尽管 Rsync 仍在向它复制。我停止了 Rsync 复制,发现挂载点已更改 - 它最初位于 /dev/sdd 上,但现在位于 /dev/sdf - 我假设它已被卸载并自动重新安装,但我对此了解不多,无法说。
因此,鉴于它仍然显示问题,是否可以说这只是一个驱动问题,即使 SMART 似乎正在通过?
如果我可以提供任何其他信息,请告诉我。
答案1
SMART属性值提示这是一个接口错误。
- 磁盘盘片可能完好无损(0 个待处理重定位、0 个已重定位、0 个损坏),并且据称该驱动器只使用了一个星期(通电小时数)并且只经历过 43 次通电,因此它基本上是“新的”。
- UDMA CRC 错误意味着电缆或端口损坏,或者接口级别出现其他问题。也可能是主板上的 SATA 控制器或设备中的控制器损坏。但此类问题稀有的. 它们通常表现为过热某些组件;SATA 控制器通常内置于主板“南桥”中,寻找靠近 SATA 端口的大型芯片,有时它有一个散热器。尝试触摸它,它不应该也很热。尝试安装一个风扇,看看是否能解决问题。
- 更常见的情况是,问题是由坏力量。检查您的 PSU;它是否提供预期的功率,或者它的电压有时会超出允许的范围(±5%,例如 12V 必须在 11.4V 到 12.6V 之间,等等)。有时主板上有传感器,可以从操作系统中使用它来监控 PSU 电压。尝试使用
sensors
来自lm_sensors 项目;应该有 GUI,但我从未尝试过。
答案2
SMART 变量的标准值从 100 或 200 开始,随着错误不断下降,直到达到阈值,此时固件会发出警报。
您的 SMART 数据的奇怪事实是,您有“读取错误率”和“寻道错误率”,但没有其他错误,尤其是没有损坏磁盘所期望的写入错误。
看起来,一旦写入数据的命令到达固件,磁盘在写入数据时不会遇到任何问题。但是,读取磁盘时有时会遇到错误,这些错误显然不是硬错误。
我猜这是计算机和磁盘之间的通信错误。我建议检查 SATA 电缆,或尝试另一根高质量的电缆。检查所有接触点以及电缆是否屏蔽良好。
我注意到,我们现在能说的任何话都只是猜测。如果你不确定,请找专业人士检查。