新服务器硬件验证测试

新服务器硬件验证测试

在将新服务器投入生产之前,验证其硬件是否有最佳实践?

例如,通过制造商的硬件测试来运行它,或者对其进行 x 小时的内存测试?

-乔希

答案1

你要找的短语是“burn in”。我通常使用 UCBD 并运行 memtest 几天,并对任何硬盘制造商执行扩展驱动器测试。新处理器的问题还不够多,不足以说服我也测试它们。

欲了解更多信息,请查看这个社区维基。

安装操作系统之前测试服务器

答案2

我喜欢运行快速内存测试,但它实际上不会产生太多负载,因此它更像是一种验证,即没有什么严重错误,而不是系统老化。

然后,我安装并运行kcbench -a -r -n -n 50。这将循环运行内核编译(使用所有 CPU),这近似于我们的实际负载,并且 Fedora 和 EPEL 中提供 kcbench,因此很容易使用。另外,我得到了一个简单的基准测试数字,让我了解新硬件的性能。

之后,检查 dmesg 是否有错误。

答案3

就我个人而言,我从未在生产机箱上做过任何这些事情。如果我从 HP 或 Sun 或任何其他公司购买了一台价值数千美元的机器,我希望他们能给我寄来一台可以正常工作的机器。我遇到的所有早期故障都发生在运行的第一天左右。既然可以在安装操作系统或配置机器时发现问题,为什么要浪费时间进行老化测试呢?

再说一次,我们所有的机器都是由 Puppet 自动配置的,所以如果在投入生产之前某些机器死机了,我们只需启动另一台机器并再次按下“开始”按钮……

相关内容