高 TLB 击落次数影响性能

高 TLB 击落次数影响性能

我们在 RHEL 6.7 上的 JBoss EAP 中运行一个应用程序,发现整个集群的性能存在很大差异。在 8 个虚拟机中,大多数虚拟机将在约 200 毫秒内响应请求,但有一两个虚拟机的响应时间为 2 秒或 4 秒。

调查该问题时,我们从 vmstat 观察到,速度较慢的服务器每 5 秒报告数十万个系统中断,而速度较快的服务器每 5 秒报告几千个系统中断。转到 /proc/interrupts 我们看到中断是 TLB Shootdowns。每隔几秒就会有 100k 到 200k 个中断。

我读了一些书来了解这些是什么(我最喜欢这个描述)。但我不知道下一步该看哪里。为什么会发出 TLB 中断?

相关内容