通过所有诊断后确认磁盘已损坏

Question 1

你不能可靠地。

或者更确切地说，您已经利用您可用的选项完成了这件事。

作为一项研究谷歌发现了，故障磁盘不一定显示异常的 SMART 值（但反过来更可靠：当它们显示异常时，它们将要失败）。

暂且不谈这一点，请记住，尽管计算中很多内容都是标准化的，但实际上硬件和软件中都存在错误，错误幅度会累积起来，等等。现实世界并不完美，硬盘与特定控制器不兼容的情况也屡见不鲜- 反之亦然。有时是固件故障，有时是一些完全不同的系统组件不工作，例如低于标准的 PSU 在特定负载峰值时会发出故障。甚至是温度变化、老化……这个列表几乎可以随意扩展。

因此，这里的标准程序是将磁盘放入明显不同的系统配置中并重新运行测试 - 但由于您已经在完全更改系统的情况下完成了此操作，因此您正确地得出结论，磁盘一定有故障。（除非正如您告诉我们的那样，您并没有改变其他一切 - 我想到的是电缆/HBA，在这种情况下假设不成立）。

编辑：我刚刚意识到只剩下一个选项；您可以搜索是否有比当前特定驱动器上更新的固件版本可用于此磁盘驱动器。如果有，您可以查看更改日志，指出您的情况中可能存在的问题。

总之，为了完全有信心（在这种特殊情况下！）确定驱动器行为异常，您需要将其送回制造商。

Answer

你不能可靠地。

或者更确切地说，您已经利用您可用的选项完成了这件事。

作为一项研究谷歌发现了，故障磁盘不一定显示异常的 SMART 值（但反过来更可靠：当它们显示异常时，它们将要失败）。

暂且不谈这一点，请记住，尽管计算中很多内容都是标准化的，但实际上硬件和软件中都存在错误，错误幅度会累积起来，等等。现实世界并不完美，硬盘与特定控制器不兼容的情况也屡见不鲜- 反之亦然。有时是固件故障，有时是一些完全不同的系统组件不工作，例如低于标准的 PSU 在特定负载峰值时会发出故障。甚至是温度变化、老化……这个列表几乎可以随意扩展。

因此，这里的标准程序是将磁盘放入明显不同的系统配置中并重新运行测试 - 但由于您已经在完全更改系统的情况下完成了此操作，因此您正确地得出结论，磁盘一定有故障。（除非正如您告诉我们的那样，您并没有改变其他一切 - 我想到的是电缆/HBA，在这种情况下假设不成立）。

编辑：我刚刚意识到只剩下一个选项；您可以搜索是否有比当前特定驱动器上更新的固件版本可用于此磁盘驱动器。如果有，您可以查看更改日志，指出您的情况中可能存在的问题。

总之，为了完全有信心（在这种特殊情况下！）确定驱动器行为异常，您需要将其送回制造商。

Question 2

我认为这是一个坏的控制器。您可以做更多的事情来检查磁盘和控制器...

在驱动器上运行“badblocks”。这类似于您运行的“dd”。取另一个具有良好 SMART 状态的驱动器并将其放入计算机中。如果此磁盘出现类似行为，则您知道是磁盘以外的硬件给您带来了问题。在这种情况下，我认为是控制器。您确实提到您更换了系统，但仍然给您带来问题，因此，说到底，我仍然认为一定有一个共同的组件导致系统不稳定。您还可以查看：

电缆损坏（电缆是否与驱动器一起交换到第二台机器？）
系统配置不良（您是否使用不同的硬件设置了相同的系统？）

Answer

我认为这是一个坏的控制器。您可以做更多的事情来检查磁盘和控制器...

在驱动器上运行“badblocks”。这类似于您运行的“dd”。取另一个具有良好 SMART 状态的驱动器并将其放入计算机中。如果此磁盘出现类似行为，则您知道是磁盘以外的硬件给您带来了问题。在这种情况下，我认为是控制器。您确实提到您更换了系统，但仍然给您带来问题，因此，说到底，我仍然认为一定有一个共同的组件导致系统不稳定。您还可以查看：

电缆损坏（电缆是否与驱动器一起交换到第二台机器？）
系统配置不良（您是否使用不同的硬件设置了相同的系统？）

Question 3

SF 提出这个问题是因为它很“值得注意”，所以我不想漏掉新的见解，即磁盘扫描。它读取磁盘并绘制扇区的延迟图，假设损坏的扇区需要重试。

以下是我手头上的一块 Seagate 磁盘通过所有传统测试的结果：

您可以看到有几个区域的延迟非常高，这显然是一个问题。

还有另一块磁盘，西部数据的：

有趣的是，使用擦除后dd，SMART 状态又恢复正常：没有待处理或重新分配的扇区。这是的后续重新运行diskscan：

所以这个 WDC 磁盘应该又好了。我运行了smartctl -t long它，然后它再次显示磁盘读取失败。

结论：diskscan有帮助，但是当然没有什么是 100% 可靠的。

Answer