我们有许多 HP DL385 G2 在安装 RHEL 5.3 后内核崩溃。所有机器都已更新至固件 CD 8.50。初始 RHEL 5.3 安装始终有效,并且在大多数情况下首次启动正常(内核 2.6.18-128.el5);到目前为止,四分之一的机器出现崩溃。我尝试过的大多数其他机器在“yum update”到内核 2.6.18-128.1.10.el5 后都无法启动。有一两台机器正常。
恐慌总是发生在同一个点。控制台上记录的最后几行是:
device-mapper: uevent: version 1.0.3
device-mapper: ioctl: 4.11.5-ioctl (2007-12-12) initialised: [email protected]
usb 4-2: new full speed USB device using uhci_hcd and address 3
device-mapper: dm-raid45: initialized v0.2429
usb 4-2: configuration #1 chosen from 1 choice
hub 4-2:1.0: USB hub found
hub 4-2:1.0: 7 ports detected
然后暂停,然后:
kernel panic - not syncing - attempted to kill init
超过这个点,内核将无法启动(包括 Anaconda 安装的 2.6.18-128.el5),只能重新安装。它似乎与这个问题在 HP 论坛上报告。
那么,有什么想法吗?我们在 RHEL 5.2 上安装了 DL385 G2,因此 5.3 中的某些东西无法与相同的硬件很好地兼容。我们尝试过将 BIOS 恢复出厂设置等。我该如何找出内核在做什么?(我已经从附加行中删除了“rhgb quiet”。)幸运的是,我们没有太多这样的盒子,我有一点时间来调查。
答案1
您是否尝试过更新 BIOS 和所有其他固件?
答案2
对于任何服务器来说,一个好的做法是禁用任何你不需要的板载东西(这是使用 vmware 服务器的通常做法)。既然你最后几行是关于 USB 的,那么关闭 USB 控制器怎么样?
编辑:删除了关于固件的讨论,首先没有看到你已经修补了它
答案3
您是否使用 HP 提供的硬件驱动程序?如果是,请尝试仅使用 vanilla 内核驱动程序。还可以尝试通过在 grub 中添加“nousb”和内核行末尾来禁用 usb。
答案4
一位同事在 g5 升级到 5u3 时也看到了类似的问题。
看起来我们在 5u2 (8.15) 上使用的 PSP 版本与 5u3 不兼容。不过,我们并没有让它无法启动。我们能够启动旧内核,将 PSP 升级到 8.20,然后再回到新内核。
然后我们当然发现了这个。