Xeon v4 处理器性能下降

Xeon v4 处理器性能下降

所以我有点困惑。我们有一个内部开发的视频处理应用程序,它自然是非常耗时的。我手上有一台带有 2 个 E5-2640v3 处理器的服务器,我能够将处理的平均 FPS 提高到 7 到 8 FPS 左右,峰值可达 11 FPS,具体取决于场景的复杂程度。

我过去的测试表明,从 v2 Xeons 升级到 v3 Xeons 时,性能有巨大的提升。

需要指出的是,该软件需要进行大量复杂的计算工作。是的,我们知道 GPU 处理会更理想,但由于我们系统的工作方式,它不仅仅是移植代码那么简单。不过,这项工作正在进行中,但可用的版本不会很快准备好。

我的台式机上有一台 1230v5,这些数字平均约为 10 到 12 FPS,峰值为 15 FPS。

现在谜底揭晓了。我设法弄到了几台配备 2x E5-2640v4 处理器的服务器进行测试。在这台服务器上(使用相同的产品版本、性能设置、操作系统版本等),平均 FPS 下降到 2 到 3 左右,峰值为 9 FPS。

以下是 2640v3 和 2640v4 的规格:

眼镜 - - - - - - 2640v3-----2640v4

  • 拱顶--------------22nm------------14nm
  • 核心------------8------------------10
  • 主题---------16-----------------20
  • 基准频率------2.6GHz-----------2.4GHz
  • 最大睿频------3.4GHz---------3.4GHz

过去,同一产品线的较新版本总是表现出性能的显著提升(例如 2640 --> 2640v2 --> 2640v3 等),但我拥有的 v4 似乎并非如此。

所有在线基准测试都显示,v4 的单核性能约为 v3 的 90%。但我只看到约 40% 的性能。基本频率下降 0.2GHz 不应导致这样的差异。我预计总体 FPS 最多会下降 1 FPS,如果不是由于处理效率的提高而保持不变的话。

现在我已经研究、更改和调整了 BIOS、虚拟机管理程序(我已尝试过 ESXi 5.5 U1,这是服务器在其操作系统兼容性图表中列出的,以及 ESXi 6.5)和操作系统中的性能设置。

我绞尽脑汁想找出性能下降的原因。有人有什么建议吗?

答案1

暂时先不考虑处理器的规格。要了解发生了什么,可能需要对应用程序的执行进行一些分析。

例如,在 Linux 上,perf 命令可以显示计数器以获取每个时钟的指令。或者,分析和示例堆栈跟踪以查看时间花在哪里。请参阅Brendan Gregg 的 perf_events 页面.他谈到线程状态分析作为一种适用于任何平台的通用方法。

除了微基准测试之外,还要不断尝试不同的变量并寻找差异。要有条不紊。RAM 大小和速度、存储系统速度、禁用省电模式、NUMA 效果,性能问题的原因有很多。

相关内容