Centos 和 dell PowerEdge Rxxx 系列

Centos 和 dell PowerEdge Rxxx 系列

我们最近购买了一些戴尔服务器,都是 Rxxx 系列的,有几台 R410 和 R710

我们在这些服务器上使用的操作系统是:CentOS 5.4

我们收到了非常奇怪的错误消息,并且几次失去了网络连接(需要重新启动网络接口才能解决这个问题)

我们收到的消息如下:
syslogd@ 于 2009 年 11 月 18 日星期三 12:07:08 ...
servername kernel 发送的消息:嗯。由于未知原因收到 NMI 20。
syslogd@ 于 2009 年 11 月 18 日星期三 12:07:08 ...
servername kernel 发送的消息:您是否启用了奇怪的省电模式?
syslogd@ 于 2009 年 11 月 18 日星期三 12:07:08 ... servername kernel 发送的消息
:茫然和困惑,但试图继续

在之前的 Dell PowerEdge 服务器系列中,我们从未见过这些消息

这里有人在 Rxxx 系列上使用 centOS 5.4 吗?他也遇到这种情况了吗?

也许你对如何防止这种情况发生有什么建议


更新:

谢谢(你的)信息

嗯,我已经联系过戴尔了,他们甚至更换了我们两台服务器的主板

事实上,我在多台服务器(一台 R410 和另一台 R710)上看到了这些奇怪的操作系统消息,这让我认为操作系统和服务器之间可能存在冲突问题

这种情况在多台服务器上发生,甚至在更换主板后也发生,这毫无道理

dell 确实说过他们不支持 centOS,我对他们的 DSET 诊断进行了检查并发送给他们,但他们没有看到任何东西。

所有固件都是最新的。

答案1

看一下http://kbase.redhat.com/faq/docs/DOC-16294寻找可能的解决方案。

解决运行 Xen 内核和 bnx2 驱动程序的 RHEL5.3 挂起问题的方法是编辑 /etc/modprobe.conf,添加以下行

选项 bnx2“disable_msi=1”

答案2

解决方案是:echo options bnx2 disable_msi=1 >> /etc/modprobe.conf /etc/init.d/network restart

我不知道戴尔是否在最近的固件更新中解决了这个问题。但我将这些参数添加到运行 CentOS 的任何 RXXX 服务器

答案3

这肯定是硬件相关的问题。除了检查服务器的 bios 和 bmc 固件是否是最新的之外,我还会联系戴尔支持并开立案例。

他们可能会说 CentOS 不是一个受支持的操作系统,但如果 R​​HEL5 是作为 OEM 购买的,他们确实支持它,并且如果您可以说服他们内核消息与硬件有关,则该案例将升级为软件支持。

为了加快速度,请他们提供 RHEL 的诊断工具,运行它们,然后发送收集到的报告。

答案4

谢谢(你的)信息

嗯,我已经联系过戴尔了,他们甚至更换了我们两台服务器的主板

事实上,我在多台服务器(一台 R410 和另一台 R710)上看到了这些奇怪的操作系统消息,这让我认为操作系统和服务器之间可能存在冲突问题

这种情况在多台服务器上发生,甚至在更换主板后也发生,这毫无道理

dell 确实说过他们不支持 centOS,我对他们的 DSET 诊断进行了检查并发送给他们,但他们没有看到任何东西。

所有固件都是最新的。

可能还有其他信息吗?关于我应该尝试解决此问题的更多想法?

谢谢

相关内容