我正在对我们公司内各种台式电脑上的应用程序进行基准测试。我们的应用程序网络负荷很大(所有处理都在服务器端完成)。我试图解释应用程序的感知性能有多少是由 CPU 使用率而不是网络使用率决定的。
从我们的数据服务器到 2 台台式机,我看到 ping 时间差异很大,并且 traceroute 显示数据包丢失。ping 响应的差异是我需要担心的事情吗?还是我应该忽略它们并关注测试机器之间的其他硬件差异?
输出(匿名,但路线与两个目标机器相同)
traceroute to testmachine1 (10.0.0.1), 30 hops max, 60 byte packets
1 somehost1 (10.1.1.1) 1.315 ms 1.328 ms 1.419 ms
2 somehost2 (10.1.1.2) 0.506 ms 0.556 ms 0.677 ms
3 somehost3 (10.1.1.3) 0.494 ms 0.492 ms 0.489 ms
4 testmachine1 (10.0.0.1) 0.658 ms 0.771 ms 0.770 ms
traceroute to testmachine2 (10.0.0.2), 30 hops max, 60 byte packets
1 somehost1 (10.1.1.1) 0.805 ms 0.804 ms 0.875 ms
2 somehost2 (10.1.1.2) 0.782 ms 0.867 ms 0.910 ms
3 somehost3 (10.1.1.3) 0.569 ms 0.570 ms 0.571 ms
4 testmachine2 (10.0.0.2) 1.234 ms * *
测试机规格
Drivers are up to date on both machines
Both running Windows 7 enterprise
Physical connections go identically through Avaya IP Phones
testmachine1 - HP Z620 - 2 x Xeon E5-2620, 12GB, 1GB onboard Intel NIC
testmachine2 - HP Z600 - 2 x Xeon E5506, 24GB, 1GB onboard Broadcom NIC
答案1
我认为你无法从通过 traceroute 获得的数据中推断出太多信息,因为它非常抽象。除非你能建立一个庞大的数据库,将其进一步转换为信息图。人类的特点是无法从数字中获取太多信息,但如果你将其转换为视觉数据,大脑就会立即产生不同的想法。
我的建议是直接从路由器收集信息。我主要关注的是 CPU 负载,但也会关注正在使用的端口、并发开放连接、带宽和其他一些因素。要使获取的数据具有实际意义,必须将其与路由器的潜力/限制进行比较。