内核几乎每天都会出现崩溃,为什么?

内核几乎每天都会出现崩溃,为什么?

运行最新版本的 CentOS 5 64。几乎每天都会收到这些,时间完全随机。该盒子是一台文件传送机,通常发送约 2.3Gbit

Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel:Oops: 0000 [#1] SMP

    Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel:last sysfs file: /sys/devices/pci0000:00/0000:00:1e.0/0000:0b:01.0/class

    Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel:Stack:

    Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel:Call Trace:

    Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel: <IRQ>

    Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel: <EOI>

    Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel:Code: ba 00 00 00 00 49 8b 07 4c 39 f8 48 0f 44 c2 49 39 c4 75 13 8b 93 c0 03 00 00 be 01 00 00 00 48 89 df e8 29 fd ff ff 4d 8b 24 24 <49> 8b 04 24 4d 39 fc 0f 18 08 0f 85 85 fe ff ff eb 14 4d 85 ed

    Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel:CR2: 0000000000000000

    Message from syslogd@localhost at Jun 28 21:53:27 ...
     kernel:Kernel panic - not syncing: Fatal exception in interrupt

答案1

/sys/devices/pci0000:00/0000:00:1e.0/0000:0b:01.0

映射到 PCI 子设备 - 执行以下操作:

lspci -v | grep "0b:01.0"

...识别该项目,然后“lspci -vv”查找有关该特定设备的更多信息。我不是内核专家,但看起来该设备存在 IRQ 问题。在我的系统上,父项 (00:1e.0) 是 Intel PCI 桥,我拥有的子设备包括 SD 卡读卡器、我的 miniPCI wifi 卡等。

/sys/devices/pci0000:00/0000:00:1e.0/0000:03:03.0/
...
$ lspci -v | grep "00:1e.0"
00:1e.0 PCI bridge: Intel Corporation 82801 Mobile PCI Bridge (rev d3) (prog-if 01 [Subtractive decode])
....
$ lspci -v | grep "03:03.0"
03:03.0 Network controller: Intel Corporation PRO/Wireless 2200BG [Calexico2] Network Connection (rev 05)

希望这可以帮助。

答案2

可能是以下原因之一:硬件驱动程序有错误或硬件有问题。我会检查内存、CPU 和系统板。如果这种情况突然发生,很可能是其中之一。

相关内容