Mac mini 与 1GbE 断开连接:RFI/EMI?

Mac mini 与 1GbE 断开连接:RFI/EMI?

我们的服务器机房中拥有几台 2012 年款 Mac mini,当相邻服务器的 CPU 负载过重时,它们会可靠地断开与 1GbE 网络的连接(但除此之外似乎仍在运行)。

我们怀疑是 RFI/EMI,但不能 100% 确定,因为我们还没有很好的方法来测量它并隔离源头。同一房间内的其他服务器(超过 50 个,各种类型,包括一堆 xserves)都很好。从服务器机房取出后,Mac Mini 都很好。

奇怪的部分:

  • 在我们向现有的三台服务器集群中添加三台新服务器(渲染节点)后,连接开始断开,这几乎可以确定它们是问题的根源
  • 当这些服务器空闲时没有问题
  • 当所有六个 CPU 负载都低于 50% 或更高时,问题似乎就开始了
  • 服务器机房中的所有其他设备(很多,各种类型)都没有问题;只有 Mac mini 受到影响

您建议如何排除故障并解决该问题?(除了关闭那些新的渲染节点 - 我们确实需要它们并且它们似乎不会影响其他任何东西。)

我们尝试过的方法:

  • 放入已知良好的 2012 Mac mini 并观察到同样的问题(除了 2012 之外,我们没有其他 Mac mini)
  • 在服务器机房内移动 Mac mini;位置之内房间似乎并不重要
  • 从渲染节点和其他设备收集 CPU 利用率数据;使用 Solarwinds NPM 收集 Mac mini 和其他网络设备的响应时间和超时数据;观察渲染节点上的 CPU 负载峰值与 Mac mini 上的网络问题之间的强相关性

PS 我们尚未完成的事情:

  • 要检查是否只有一台服务器出现问题,请一次断开一台服务器的连接,同时让其余服务器处于 100% CPU 负载下
  • 研究 RFI/EMI 测量和隔离设备和服务
  • 尝试将 Mac mini 接地(其电源线是两芯的,没有接地)或以其他方式屏蔽 RFI / EMI

我们确实需要 Mac mini,因为我们的 Xserves 快用完了,而且某些应用程序只能在 Mac 上运行。

PPS 如果这与主题无关或涉及错误的论坛,敬请原谅。

感谢您的任何想法!

答案1

罪魁祸首是 HP G8 服务器上的一个特定附加 4 端口 NIC,当网络负载过大时,会导致 Mac Mini 断开连接。一旦我们虚拟化了服务器,将 HP 服务器重新用于不需要高网络利用率的其他用途 - 问题就消失了。换句话说,这不是 EMI/RFI,而是 Mac Mini 对网络上非常特定的事件很敏感。我们在网络上有相当多的其他节点,包括各种 Mac Pro、XServes、iMac、MBP、各种服务器和各种设备 - 没有一个有问题,只有 Mac Mini。

另一部分原因是,该问题只会发生在同一房间(数据中心)的 Mac Mini 上 - 因此也许这些 Mac Mini 连接到该房间网络的方式(电缆、交换机)也起了作用。

相关内容