昨天得到了一个全新的服务器(IBM x3500),在其上安装了 Fedora 12,我们想运行一些代码来看看它的性能。
运行大约 7 个小时后,系统似乎停止了。
症状是 - 风扇仍在运转,即系统听起来像是在运行。显示器、鼠标和键盘未接通电源,并且已禁用。CD 托盘仍在打开/关闭。链接灯闪烁。
我首先想到的是温度,但找不到任何有关温度的信息/日志。
重新启动后,我似乎找不到任何看起来像系统日志的日志文件。
你会在哪里寻找原因?
编辑:更多信息
刚刚又发生了,在类似的情况下。
经过 3.5 小时的繁重程序后:砰!
我当时确实有一个“顶部”:
top - 15:26:41 up 4:26, 4 users, load average: 2.67, 2.38, 2.37
Tasks: 246 total, 3 running, 243 sleeping, 0 stopped, 0 zombie
Cpu(s): 48.2%us, 1.5%sy, 0.0%ni, 48.4%id, 1.1%wa, 0.0%hi, 0.9%si, 0.0%st
Mem: 8252304k total, 8192272k used, 60032k free, 23592k buffers
Swap: 10354680k total, 146024k used, 10208656k free, 6350148k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3934 pstanton 20 0 1881m 322m 3900 S 99.5 4.0 141:57.88 java
3894 pstanton 20 0 1881m 336m 3896 S 95.2 4.2 169:54.01 java
3914 pstanton 20 0 1881m 315m 3936 S 84.6 3.9 151:52.13 java
3875 pstanton 20 0 1881m 271m 3948 S 73.3 3.4 179:25.13 java
3893 pstanton 20 0 317m 208m 206m S 31.2 2.6 33:22.98 postgres
3932 pstanton 20 0 317m 208m 206m S 16.9 2.6 63:02.05 postgres
3912 pstanton 20 0 317m 208m 206m R 6.6 2.6 43:27.91 postgres
4292 pstanton 20 0 325m 13m 4032 S 1.3 0.2 0:00.37 postgres
4288 pstanton 20 0 325m 22m 12m S 0.7 0.3 0:03.45 postgres
59 root 15 -5 0 0 0 S 0.3 0.0 0:03.81 ata/1
358 root 15 -5 0 0 0 S 0.3 0.0 0:04.54 kjournald2
1585 root 20 0 165m 7204 2168 S 0.3 0.1 1:37.06 Xorg
2002 root 20 0 42192 380 308 S 0.3 0.0 0:04.03 devkit-disks-da
3968 pstanton 20 0 288m 7280 3760 S 0.3 0.1 0:02.08 gnome-terminal
4291 pstanton 20 0 325m 13m 4076 S 0.3 0.2 0:01.41 postgres
4337 pstanton 20 0 15036 1244 848 R 0.3 0.0 0:00.09 top
1 root 20 0 4056 596 492 S 0.0 0.0 0:00.91 init
我知道我正在使用交换内存,这并不好,但这不应该停止服务器吗?
另外,这次我已经插入了键盘、鼠标和显示器,并且键盘和鼠标都有电,但显示器却是空白的(甚至没有光标)。
答案1
我认为您需要进入 BMC 来获取硬件的错误日志,或者您需要运行 IBM Director。
此外,如果您的服务器中有 RSA 卡,您可以访问 RSA 卡的网页,它会显示上次检测到的硬件错误。
答案2
系统错误日志应该会告诉您发生了什么;不过,我倾向于提出保修故障并让 IBM 解决 - 尽管您可能需要在受支持的操作系统上重现该问题,他们才会认真对待您。
答案3
这可能是由于 Fedora 的二进制文件不好造成的。此后,我们又安装了另外 2 个操作系统,没有任何问题。谢谢您的回答。