我们最近购买了一些戴尔服务器,都是 Rxxx 系列的,有几台 R410 和 R710
我们在这些服务器上使用的操作系统是:CentOS 5.4
我们收到了非常奇怪的错误消息,并且几次失去了网络连接(需要重新启动网络接口才能解决这个问题)
我们收到的消息如下:
syslogd@ 于 2009 年 11 月 18 日星期三 12:07:08 ...
servername kernel 发送的消息:嗯。由于未知原因收到 NMI 20。
syslogd@ 于 2009 年 11 月 18 日星期三 12:07:08 ...
servername kernel 发送的消息:您是否启用了奇怪的省电模式?
syslogd@ 于 2009 年 11 月 18 日星期三 12:07:08 ... servername kernel 发送的消息
:茫然和困惑,但试图继续
在之前的 Dell PowerEdge 服务器系列中,我们从未见过这些消息
这里有人在 Rxxx 系列上使用 centOS 5.4 吗?他也遇到这种情况了吗?
也许你对如何防止这种情况发生有什么建议
更新:
谢谢(你的)信息
嗯,我已经联系过戴尔了,他们甚至更换了我们两台服务器的主板
事实上,我在多台服务器(一台 R410 和另一台 R710)上看到了这些奇怪的操作系统消息,这让我认为操作系统和服务器之间可能存在冲突问题
这种情况在多台服务器上发生,甚至在更换主板后也发生,这毫无道理
dell 确实说过他们不支持 centOS,我对他们的 DSET 诊断进行了检查并发送给他们,但他们没有看到任何东西。
所有固件都是最新的。
答案1
看一下http://kbase.redhat.com/faq/docs/DOC-16294寻找可能的解决方案。
解决运行 Xen 内核和 bnx2 驱动程序的 RHEL5.3 挂起问题的方法是编辑 /etc/modprobe.conf,添加以下行
选项 bnx2“disable_msi=1”
答案2
解决方案是:echo options bnx2 disable_msi=1 >> /etc/modprobe.conf /etc/init.d/network restart
我不知道戴尔是否在最近的固件更新中解决了这个问题。但我将这些参数添加到运行 CentOS 的任何 RXXX 服务器
答案3
这肯定是硬件相关的问题。除了检查服务器的 bios 和 bmc 固件是否是最新的之外,我还会联系戴尔支持并开立案例。
他们可能会说 CentOS 不是一个受支持的操作系统,但如果 RHEL5 是作为 OEM 购买的,他们确实支持它,并且如果您可以说服他们内核消息与硬件有关,则该案例将升级为软件支持。
为了加快速度,请他们提供 RHEL 的诊断工具,运行它们,然后发送收集到的报告。
答案4
谢谢(你的)信息
嗯,我已经联系过戴尔了,他们甚至更换了我们两台服务器的主板
事实上,我在多台服务器(一台 R410 和另一台 R710)上看到了这些奇怪的操作系统消息,这让我认为操作系统和服务器之间可能存在冲突问题
这种情况在多台服务器上发生,甚至在更换主板后也发生,这毫无道理
dell 确实说过他们不支持 centOS,我对他们的 DSET 诊断进行了检查并发送给他们,但他们没有看到任何东西。
所有固件都是最新的。
可能还有其他信息吗?关于我应该尝试解决此问题的更多想法?
谢谢