一台服务器比另一台相同的服务器慢 33%。如何排除故障?

一台服务器比另一台相同的服务器慢 33%。如何排除故障?

我有两台 Windows 2008 R2 64 位服务器,它们在各个方面几乎完全相同。每台服务器都有一个应用程序,基本上可以进行大量计算。硬盘实际上根本没有被访问。该应用程序对 CPU 的占用非常大。

但令人费解的是,其中一台服务器处理的数据比另一台少了 1/3。

我检查了一遍又一遍,但一切似乎都一样。我逐个检查了 CPUZ,以确保每一块内存和时序都完全相同 - 但都无济于事。我检查了每个应用程序的亲和性,以确保它利用了所有 CPU。

每个盒子有 2 个物理 CPU(每个 CPU 有 4 个核心)。

我怎样才能排除为什么一个盒子比另一个盒子慢?

答案1

与许多 IT 问题类似,您必须划分问题、衡量,然后再次划分……

如果可以的话,我会将“慢速”服务器的硬盘移到“快速”服务器的硬件上,问题是否出在磁盘上?如果是,那么你可能遇到了操作系统/文件系统/配置问题,如果不是,那么也许你的硬件已经损坏/半损坏了。

如果问题确实出在磁盘上,那么我建议您从基于 CD/ISO 的操作系统启动并执行某种形式的 CPU、内存和磁盘测试套件,然后在常规的基于磁盘的操作系统上重复测试,这应该有助于确定您是否有操作系统或文件系统问题。

然后基本上将问题不断划分为多个区域,每次都是 50/50(或尽可能接近)。

答案2

我同意 Chopper3 的观点,但我想补充以下几点供考虑:

检查两个系统的 Bios 是否有差异。特别注意与电源管理、Speedstep/EIST(英特尔)或 Cool'n Quit(AMD)相关的设置。

如果 BIOS 有显示电压和/或温度的屏幕,也请比较它们。也许电源或机壳温度不同,导致一个系统对现代 CPU 可以实现的自动加速/减速有更大的余地。

这种事情在 CPU-Z 中并不总是可见的,所以检查一下也不会有什么坏处。

另外要检查的是:硬件的所有驱动程序是否相同?特别注意主板驱动程序和网卡。此处不稳定的驱动程序可能会导致严重的速度减慢。

两台机器是否在同一个网络上,并且看到相同的流量?如果其中一台必须处理比另一台多得多的广播流量,则可能会导致额外的负载。(我曾经有一台服务器,在一位同事尝试使用网络监控软件后,网卡处于混杂模式。我花了一两天时间才弄清楚发生了什么。)

答案3

1 - 更新所有驱动程序。2 - 检查系统属性->性能选项->处理器调度选项卡,选择调整最佳性能:(程序)我认为那可能更好,:)至少检查它们在两个服务器中是否相等。

如果它们相等我们就必须尝试其他的东西。:)

相关内容