测试廉价存储服务器新硬盘的最佳方法

测试廉价存储服务器新硬盘的最佳方法

我想搭建一个存储服务器,买了10 x 2TB WD RED'sHDD's刚刚到货。

在将真实数据复制到磁盘之前,你们使用什么工具来检查坏驱动器或最好地防止早期死亡率?

检查每个单个数据还是通过复制大量数据HDD来测试数组( )更好?ZFS raid-z2

答案1

2 个月前我也遇到过同样的问题。在发送故障磁盘后,替换磁盘在 3 天后在我的 NAS 中发生故障。因此,我决定在将新替换磁盘投入生产之前对其进行测试。我不会测试我购买的每个新磁盘,只会测试“翻新”磁盘,但我并不完全信任这些磁盘。

如果你决定要测试这些磁盘,我建议你运行坏块对全新硬盘进行扫描和扩展的 SMART 测试。

在 2TB 的磁盘上,这最多需要 48 小时,badblock 命令会用一种模式将磁盘写满,然后再次读取块以查看该模式是否真的存在,并使用 4 种不同的模式重复此操作。

此命令实际上可能不会显示新磁盘上的任何坏块,因为磁盘现在会重新分配坏块。

因此,在此之前和之后,我进行了一次智能测试,并检查了重新分配和当前待处理的扇区数。如果其中任何一个增加了,则表明您的磁盘已经有一些坏块,因此可能不值得信任。

此后我再次运行扩展 SMART 测试。

您可能需要先安装 smartctl 或 smartmontools。

警告,badblocks -w 标志将覆盖磁盘上的所有数据,如果你只想进行读取检查,而不覆盖磁盘,请使用badblocks -vs /dev/sdX

sudo smartctl -a /dev/sdX
# record these numbers
sudo badblocks -wvs /dev/sdX
# let it run for 48 hours
sudo smartctl -a /dev/sdX
# compare numbers
sudo smartctl -t long /dev/sdX
# this might take another hour or 2, check results periodically with
sudo smartctl -a /dev/sdX

如果此后您的智能值看起来没问题,我会信任该磁盘。

要了解每个智能值的含义,您可以开始从这里查看

http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology

答案2

这些是新磁盘。它们要么会失败,要么不会。使用 ZFS 文件系统,你已经领先了一大步,这将使您深入了解您的 raid 和文件系统的健康状况...

除了构建阵列之外,我不会做任何其他事情。这就是冗余的意义所在。您无法使用列出的其他方法导致驱动器故障。

答案3

您可以使用Bonnie++进行测试。它可以完美模拟文件服务器行为模式。

例如:

# bonnie++ -u nobody -d /home/tmp -n 100:150000:200:100 -x 300

测试将以用户“nobody”的身份运行,并将在 /home/tmp 下 100 个自动创建的目录中创建/重写/删除 100*1024 个文件,每个文件大小从 200 到 150000 字节不等。测试次数 = 300。您可以尝试不同的文件数量/大小和测试重复次数。

答案4

我通常只进行完整的 RAID 初始化,并在适当的情况下开始填充文件系统,同时始终知道可能会由于驱动器损坏而出现问题。这样,我就不会浪费时间进行一些本来就很不可靠的测试,而且我会立即发现真正有问题的驱动器。在此之后,由于“早期死亡率”,驱动器故障的可能性可能仍然会有所增加,但没有切实可行的方法来消除这种情况。

实际上,我在 RAID 中使用的最后几百个磁盘在运行的第一年都没有出现任何问题。

相关内容