我们在数据中心安装了一台 HP Proliant DL160G5,经过一年的良好运行后,它开始出现不稳定现象,但我们无法将其追溯到特定的硬件元素。在进行硬件升级时,我们用其他服务器替换了它,并将其带到我们的办公室,然后让 HP 更换了主板,我们更换了磁盘。我正在尝试对它进行一些压力测试,看看我是否可以重现不稳定现象。
习惯了戴尔服务器,这个东西嘈杂对我来说“听起来”很奇怪!我们的戴尔服务器在开机后几秒钟内风扇会全速运转,然后减速。当负载过大时,风扇会慢慢变快。
这个该死的东西实际上是这样的:
- 开机时,风扇会保持低转速(我会说低于 3k RPM)持续 40 秒,控制台上没有输出,没有 IPMI 读数
- 然后它会显示带有 HP 徽标的白色屏幕,IPMI 读取所有风扇的转速为 3.0~3.5k RPM,环境温度约为 40°C,无 CPU 温度读数。这种情况持续大约 2.5 分钟。
- 然后它会显示已安装硬件的文本摘要,并继续启动引导加载程序(在我的情况下是 grub)。风扇将飞速旋转至 12~13k RPM,环境温度降至 25°C,CPU 温度读数大致相同
- 再过 4 到 5 分钟,风扇转速会降到 9~10k RPM,并保持在该转速,所有温度都稳定在 25 到 30 °C 之间,同时启动完全空闲的 Ubuntu 10.04 服务器
- 如果我让 4 个 CPU 核心全部使用 100%,那么 CPU 温度会稍微上升然后稳定下来,风扇不会变快
有没有人有相同的 HP 服务器或类似的服务器可以比较?在正常使用期间,风扇转速超过 9k RPM 是否正常?我们的戴尔,从较旧的 SC1425 到较新的 R300,在更热的机架中,风扇速度都保持在一半。
我的服务器配置是:
- HP Proliant DL160G5,配备 1 个 Xeon E5405
- 2x1G + 2x2G + 2x4G = 14GiB 内存
- SATA 非热插拔 4 磁盘背板,装有 2 个 160GB 7200rpm 磁盘
- 无 PCI 附加卡,标准单个非热插拔 PSU
我用了分布式网络客户端的 4 个核心利用率达到 100%,这是纯 CPU 负载,没有内存或磁盘负载。
答案1
我想说是的,这很正常 - 那些 1U HP 服务器发出很大的噪音!
我的服务器机房里有一台 Proliant DL360(与您的不同,但仍然是 1U),它是最吵闹的服务器之一(如果不是这房间里最吵的服务器。我有一次关闭它的理由,当它关闭时,房间里的噪音大大降低了。
您可能想看看是否有任何可用的固件更新并应用它们 - 它们可以解决一些奇怪而又奇妙的问题,并且对您的服务器也有好处。我之前曾用它们解决过热报告以及一些风扇问题。
您可能还值得花点时间查看 BIOS 中是否有风扇设置。我对此表示怀疑,就像我说的,1U 服务器的噪音很小 - 但你永远不知道。