操作系统:CentOS 5.5 64 位
软件:Postgresql
硬件:Sun X4200;双核 AMD Opteron 1Ghz (x4);8GB RAM;LSILogic raid 控制器 + 2x146GB 10k 驱动器。
运行net-snmp并使用Traverse进行监控。
每秒持续发生 2,000 多次系统中断。Traverse 将此标记为“严重”(默认配置)... 这个数字真的值得关注吗?
查看中断的高数字结果:
[~]# cat /proc/interrupts
CPU0 CPU1 CPU2 CPU3
14: 136 54655160 2332995 722234 IO-APIC-edge ide0
66: 618 329180300 20802132 172490 IO-APIC-level ohci_hcd:usb2
74: 4949 16107320 2295957 846017 IO-APIC-level ioc0
82: 22 662837259 233 129090405 IO-APIC-level eth0
90: 723 505860358 0 18967685 IO-APIC-level eth2
NMI: 187529 250006 100435 166795
LOC: 2140313519 2140313343 2140313287 2140313203
ERR: 0
MIS: 0
关于上述输出的附加问题:为什么 ide0 和 usb2 显示中断不断累积,即使没有连接 USB 设备,并且 IDE 设备 (CDROM) 未使用?这个问题是出于我自己的好奇心。
答案1
LOC
在这些内核中,以 1000 Hz 运行的中断是正常的 — 该内核版本不支持动态滴答,因此计时器中断会持续运行。如果系统的网络和磁盘负载很高,其他中断可能也是正常的。
最可疑的是ohci_hcd:usb2
中断 — — 也许某些 USB 设备正在(或曾经)出现故障(或者只是使用频繁,那么这是正常的)。
答案2
我也看到了,所以我不这么认为:
http://www.teaparty.net/munin/net/teaparty.net-irqstats.html
(去年 6 月硬件已全部更换,因此价格突然上涨)
这篇 serverfault 文章和这篇站外文章其中所引述的论述也发人深省。