每秒 2,000 次系统中断:值得担忧吗?

每秒 2,000 次系统中断:值得担忧吗?

操作系统:CentOS 5.5 64 位
软件:Postgresql
硬件:Sun X4200;双核 AMD Opteron 1Ghz (x4);8GB RAM;LSILogic raid 控制器 + 2x146GB 10k 驱动器。

运行net-snmp并使用Traverse进行监控。

每秒持续发生 2,000 多次系统中断。Traverse 将此标记为“严重”(默认配置)... 这个数字真的值得关注吗?

查看中断的高数字结果:

[~]# cat /proc/interrupts   
           CPU0       CPU1       CPU2       CPU3         
 14:        136   54655160    2332995     722234    IO-APIC-edge  ide0  
 66:        618  329180300   20802132     172490   IO-APIC-level  ohci_hcd:usb2  
 74:       4949   16107320    2295957     846017   IO-APIC-level  ioc0  
 82:         22  662837259        233  129090405   IO-APIC-level  eth0  
 90:        723  505860358          0   18967685   IO-APIC-level  eth2  
NMI:     187529     250006     100435     166795   
LOC: 2140313519 2140313343 2140313287 2140313203   
ERR:          0  
MIS:          0  

关于上述输出的附加问题:为什么 ide0 和 usb2 显示中断不断累积,即使没有连接 USB 设备,并且 IDE 设备 (CDROM) 未使用?这个问题是出于我自己的好奇心。

答案1

LOC在这些内核中,以 1000 Hz 运行的中断是正常的 — 该内核版本不支持动态滴答,因此计时器中断会持续运行。如果系统的网络和磁盘负载很高,其他中断可能也是正常的。

最可疑的是ohci_hcd:usb2中断 — — 也许某些 USB 设备正在(或曾经)出现故障(或者只是使用频繁,那么这是正常的)。

答案2

我也看到了,所以我不这么认为:

http://www.teaparty.net/munin/net/teaparty.net-irqstats.html

(去年 6 月硬件已全部更换,因此价格突然上涨)

这篇 serverfault 文章这篇站外文章其中所引述的论述也发人深省。

相关内容