在部署灰色市场硬件之前您要执行哪些测试?

在部署灰色市场硬件之前您要执行哪些测试?

从 IT 角度来看,我们是一家小公司,几乎所有的服务器和网络硬件都是从灰色市场供应商处购买的 - 通常通过 eBay。我有兴趣在将这些灰色市场硬件部署到生产中之前开发更严格的测试流程。对于这种情况,建议使用哪些硬件压力测试、测试套件等?

笔记:对于这个问题,我无意讨论购买新硬件或灰市硬件的优点。考虑到我们的规模和预算,我们认为从灰市购买(无论是二手硬件还是新硬件)最划算。谢谢。

典型服务器配置

  • 服务器:IBM x335、x345 和 HS20 刀片
  • HDD:以 RAID1 或 RAID5 配置运行的 SCSI
  • 操作系统:Ubuntu Server 8.04LTS 或 9.10

可能相关的 ServerFault 问题

答案1

我们在 $JOB 购买了相当数量的二手 IBM 设备以及新设备。现在都是 HS/LS 刀片,但过去我们有很多 x3** 披萨盒。我相信您知道,从其他人的租赁协议结束和硬件更新中可以获得一些很棒的东西。通常甚至在制造商保修期还剩一段时间的情况下也是如此。

通常,我们所见到的任何问题都会很快出现,并会在 BladeCenter 或 BIOS 的事件日志中显现出来。通常只需运行机器一小段时间并重新启动即可解决这些问题。

装上驱动器的 S/H 设备并不常见。每当我们看到它们时,它们都会被扔掉。旋转介质几乎总是硬件链中最薄弱的环节。您不知道驱动器是否以前出现过问题或在运输途中掉落。购买新驱动器非常便宜,因此不值得我们费心。

至于使用什么工具的技术问题。由于您似乎只处理 IBM 机器,因此您不妨使用 IBM 已经提供的方便而全面的诊断工具。只需在启动时按 F2 即可。

答案2

我认为这取决于您的正常运行时间要求,以及您所处理的“灰色市场”的级别。

如果您对正常运行时间的要求很高,那么您需要依赖基础设施冗余,这样一台机器的丢失并不意味着您的客户无法获得服务。购买双机,内置冗余,并监控您的主机和网络,以便您知道何时需要更换某些东西。

如果您对正常运行时间的要求不是很高,但您只需要可以正常工作的硬件,那么请评估您购买的供应商。不要购买不能保证非 DOA 的东西。如果可以,请从至少有 90 天保修期的翻新店购买,如果您负担得起,一年保修期会更好,并确保如果原厂停产,您可以从其他来源获得所购买产品的备件。

答案3

我最喜欢的是 memtestp 和 iozone。

答案4

我通常使用外部介质(例如 USB 闪存或网络 PXE 启动到 ramdisk)来启动被测系统。这样我就可以以破坏性的方式测试驱动器并开发一个良好的多用途测试环境。

对于驱动器测试,我在原始设备上使用 badblocks 破坏性 4 次通过测试,例如

badblocks -vw /dev/sda 

注意:这将清除驱动器上的所有数据!如果您有多个驱动器,并行测试它们可能会进一步增加系统压力。

编译 Linux 内核被认为是一项很好的整体系统测试。我为每个 CPU 核心运行一个编译循环。配置一个默认内核源代码树并为每个实例复制它。然后在每个实例中执行以下操作:

while (1); do make clean && make bzImage; done

当内核编译正在进行时,你可能需要用传感器监视 CPU 温度,例如:

while (true) do sensors | grep Temp; sleep 5; done

运行 24 小时后您将会得到一个良好而可靠的系统。

相关内容