如果这个问题开始变得很模糊,我很抱歉,但我不知道该怎么办。
我们有 4 台戴尔 R610 服务器,配备 2 x 2.8GHZ Intel 5650 和 16GB Ram。
这些服务器只是随机地自行重启
这是服务器 1 的最近几次重启
reboot system boot 3.11.0-15-generi Thu Jun 26 19:43 - 20:33 (00:49)
reboot system boot 3.11.0-15-generi Tue Jun 24 01:15 - 20:33 (2+19:17)
重启时 syslog 和 kern.log 没有任何内容
内核日志
Jun 24 01:51:36 encoder1 kernel: [ 2319.677008] traps: vlc[29658] trap divide error ip:7fbefd013f3a sp:7fbede8bcd58 error:0 in libc-2.15.so[7fbefcfd8000+1b5000]
Jun 24 01:51:37 encoder1 kernel: [ 2320.681917] traps: vlc[29676] trap divide error `ip:7f5c23cdbf3a sp:7f5c0553dd58 error:0 in libc-2.15.so[7f5c23ca0000+1b5000]`
Jun 26 19:43:59 encoder1 kernel: imklog 5.8.6, log source = /proc/kmsg started.
Jun 26 19:43:59 encoder1 kernel: [ 0.000000] Initializing cgroup subsys cpuset
系统日志
Jun 26 19:37:52 snmpd[1613]: last message repeated 12 times
Jun 26 19:38:52 snmpd[1613]: last message repeated 2 times
Jun 26 19:43:59 encoder1 kernel: imklog 5.8.6, log source = /proc/kmsg started.
Jun 26 19:43:59 encoder1 rsyslogd: [origin software="rsyslogd" swVersion="5.8.6" x-pid="1180" x-info="http://www.rsyslog.com"] start
我们可以访问 iDrac,最后一条消息是:
"A fatal IO error detected on a component at"
我不知道该去哪里找。服务器 1 刚刚被替换为相同的服务器,但这也没有解决问题
很抱歉,这里的信息太少了。请询问任何信息,我会尽快提供给您。
提前致以问候和感谢
答案1
我建议使用打开管理可启动 CD对机器运行诊断程序。这将为您提供有关服务器上多个设备和传感器的健康状况的详细报告。如果您的服务器在保修/支持期内,这可能是戴尔推荐的首批工具之一。
CD 将启动到 CentOS 环境。桌面上应该有一个图标来运行报告。链接中的 ReadMe 文件包含有关运行实用程序的更多详细信息。