我意识到有时我们的一台由 Munin 监控的服务器会出现奇怪的“中断和上下文切换”图形。
该服务器配备 Xeon 5560(8 核)和 8GB RAM。
在高峰时段,平均负载不超过 5,CPU 使用率不超过 20%。
但与此同时,我们记录到的中断数量非常高(最大值:100k)。Munin 似乎在此时停止绘制图表。
https://i.stack.imgur.com/ctg0Z.png
https://i.stack.imgur.com/3Ncmb.png
这是实现 100k 的真正问题吗?
当发生这种情况时会发生什么?
这会影响该服务器上运行的应用程序的性能吗?
感谢您的帮助 !
答案1
令人费解的是,中断插件明确将可图形值限制为 100K:
# munin-run interrupts config | grep '\.max'
intr.max 100000
ctx.max 100000
可以修改脚本以不发出这些选项。理想情况下,插件将在上游进行修改,以便未来版本的 munin 受益。
答案2
这是一个非常大胆的猜测:当连接到 100 Mbps 网络的服务器协商 100Mbps 半双工连接而不是 100 Mbps 全双工连接时,我看到上下文切换和中断都大幅增加。
我不知道 SmartFox Server 是什么。如果它是一个 Java 应用程序,那么在某些情况下也会引起上下文切换风暴。
您使用的是什么操作系统?是否已完全修补?您的服务器固件是否是最新的?