我应该如何刻录硬盘?

我应该如何刻录硬盘?

谷歌做了一个非常深入的研究对硬盘故障的研究发现,很大一部分硬盘在大量使用后的前 3 个月内就会发生故障。

我和同事们正在考虑,我们可以对所有新硬盘实施老化测试流程,这样可以避免我们浪费时间在未经测试的新硬盘上。但在实施老化测试流程之前,我们想从更有经验的人那里获得一些见解:

  • 在开始使用硬盘之前刻录它有多重要?
  • 如何实施老化过程?
    • 您要在硬盘中刻录多长时间?
    • 您使用什么软件来刻录驱动器?
  • 对于老化过程来说多大的压力才算过大?

编辑:由于业务性质,大多数时候无法使用 RAID。我们不得不依靠经常邮寄到全国各地的单个驱动器。我们会尽快备份驱动器,但在有机会备份数据之前,我们仍然会遇到一些故障。

更新

我的公司已经实施了一段时间的老化过程,事实证明它非常有用。我们会立即老化所有新进货的硬盘,这样我们就能在保修到期前和安装到新电脑系统之前发现许多错误。事实证明,它对于验证硬盘是否出现故障也很有用。当我们的一台电脑开始遇到错误并且硬盘是主要嫌疑人时,我们会在该硬盘上重新运行老化过程并查看任何错误,以确保问题确实是出在硬盘上,然后再开始 RMA 过程或将其扔进垃圾箱。

我们的磨合过程很简单。我们有一个带有大量 SATA 端口的指定 Ubuntu 系统,并且我们以读/写模式运行坏块,每个驱动器运行 4 次。为了简化操作,我们编写了一个脚本,打印“数据将从所有驱动器中删除”警告,然后在系统驱动器以外的每个驱动器上运行坏块。

答案1

在开始使用硬盘之前刻录它有多重要?

如果您有良好的备份和良好的高可用性系统,则不会有太大影响。因为从故障中恢复应该相当容易。

您如何实施老化过程?您使用什么软件来老化驱动器?老化过程中多大的压力才算过大?

我通常会跑坏块当我拿到驱动器或新系统时,我会对其进行测试。每当我从备用堆中恢复计算机时,我都会运行它。像这样的命令(badblocks -c 2048 -sw /dev/sde)实际上会以不同的模式(0xaa、0x55、0xff、0x00)每次写入每个块 4 次。此测试不会测试大量随机读取/写入,但它应该证明每个块都可以写入和读取。

你也可以运行邦尼++, 或者离子计它们是基准测试工具。它们应该会尝试对您的驱动器施加一些压力。即使您尝试将其最大化,驱动器也不会发生故障。因此,您不妨尝试看看它们能做什么。但我不会这样做。在安装/设置时获取存储系统的 I/O 基准测试可能在将来您查看性能问题时非常有用。

您要在硬盘中刻录多长时间?

我认为一次坏块运行就足够了,但我相信我有一个非常强大的备份系统,而且我的 HA 需求并不高。我可以承受一些停机时间来恢复我支持的大多数系统上的服务。如果您非常担心,认为可能需要多遍设置,那么您可能应该有 RAID、良好的备份和良好的 HA 设置。

如果时间紧迫,我可能会跳过磨合。我的备份和 RAID 应该没问题。

答案2

IMNSHO,您不应该依赖老化过程来清除坏驱动器并“保护”您的数据。开发和实施此程序将占用本可以更好地用于其他用途的时间,即使驱动器通过老化,几个月后仍可能会出现故障。

您应该使用 RAID 和备份来保护您的数据。一旦这些准备就绪,就让它来负责驱动器。好的 RAID 控制器和存储子系统将具有“清理”过程,可以不时检查数据并确保一切正常。

一旦处理完所有问题,就无需进行磁盘清理,尽管其他人提到过,进行系统负载测试以确保一切按预期运行也无妨。我根本不担心单个磁盘。


正如评论中提到的,对于你的特定用例来说,使用硬盘没什么意义。运送硬盘更有可能导致数据错误,而这些错误在你进行老化时是不会出现的。

磁带介质设计用于运输。使用单个 IBM TS1140 驱动器,您可以获得 250MBps(或压缩后高达 650MBps)的速度,这应该比您的硬盘驱动器更快。而且容量也更大 - 单个磁带盒可以为您提供高达 4TB(未压缩)的容量。

如果您不想使用磁带,请使用 SSD。它们可以比 HDD 承受更严苛的考验,并满足您迄今为止提出的所有要求。


说了这么多,下面是我对您的问题的回答:

  • 在开始使用硬盘之前将其刻录到硬盘中有多重要?
    一点也不。
  • 如何实施老化过程?
    • 您在硬盘中刻录的时间有多长?
      一次还是两次。
    • 你用什么软件刻录驱动器?
      简单运行一下,比如说,shredbadblocks可以了。之后检查 SMART 数据。
  • 对于老化过程来说,多大的压力才算太大?
    没有什么压力是太大的。你应该能够把任何东西扔到磁盘上,磁盘也不会爆炸。

答案3

根据您的澄清,任何老化过程似乎对您都没有任何用处。驱动器故障主要是由于机械因素(通常是热量和振动),而不是由于任何隐藏的定时炸弹。“老化”过程对安装环境的测试与其他任何事情一样多。一旦您移动了东西,您就回到了开始的地方。

但以下几点或许能帮到你:

笔记本电脑硬盘通常设计为比台式机硬盘更能承受撞击和振动。出于这个原因,我在数据恢复店工作的朋友总是通过笔记本电脑硬盘将数据发送给客户。我从未测试过这个事实,但这似乎是某些行业的“常识”。

闪存驱动器(例如 USB 拇指驱动器)是所有介质中抗震性最强的。如果您使用闪存介质,则传输过程中丢失数据的可能性更小。

如果你运送温彻斯特硬盘,请在使用前进行表面扫描。或者更好的办法是,将其投入使用。相反,您可能希望将某些驱动器指定为“运输”驱动器,这些驱动器会受到所有滥用,但您不必依赖它们来确保数据完整性。(即:将数据复制到驱动器上进行运输,运输后复制,双方都进行校验,诸如此类)。

答案4

您的流程是错误的。您应该使用 RAID 阵列。在我工作的地方,我们制造了坚固耐用的 RAID 阵列,旨在便于携带。这不是火箭科学。

将驱动器安装在带有大型橡胶隔振器的超大外壳中,可以大大提高可靠性。(例如,Seagate constellation-es 驱动器的额定冲击为 300G,但非工作状态下的振动仅为 2G:因此运输箱需要对驱动器进行隔振。http://www.novibes.com/Products&productID=62或者http://www.novibes.com/Products&productId=49[部件号 #50178])


但是,如果您确实想要对硬盘进行老化测试,那么就可以这样做。

我曾经研究过硬盘和烧录之类的系统,发现了一些问题,但是......

为了加速 PCB 的生命周期测试以找出故障,没有什么比一些热/冷循环更有效了。(操作热冷循环效果更好......但对您来说更难做到,尤其是在使用 HDD 组的情况下)

获得一个足够大的环境室,以容纳您一次获得的驱动器数量。(这些非常昂贵,运送 raid 阵列会更便宜)您不能在测试室上吝啬,您需要湿度控制和可编程坡道。

编程两个重复的温度坡道,从最低存储温度到最高存储温度,使坡道陡峭到足以让硬盘制造商的应用工程师感到不安。12 小时内 3 次冷热循环应该会看到驱动器很快出现故障。像这样运行驱动器至少 12 小时。如果之后有任何效果,我会感到惊讶。

我没有想到这一点:我工作过的一个地方,有一名生产工程师这样做了,为了使用相同的测试设备运送更多的产品,测试中的故障数量激增,但到货时死亡率几乎降至零。

相关内容