Fedora 停止了-不知道为什么

Fedora 停止了-不知道为什么

昨天得到了一个全新的服务器(IBM x3500),在其上安装了 Fedora 12,我们想运行一些代码来看看它的性能。

运行大约 7 个小时后,系统似乎停止了。

症状是 - 风扇仍在运转,即系统听起来像是在运行。显示器、鼠标和键盘未接通电源,并且已禁用。CD 托盘仍在打开/关闭。链接灯闪烁。

我首先想到的是温度,但找不到任何有关温度的信息/日志。

重新启动后,我似乎找不到任何看起来像系统日志的日志文件。

你会在哪里寻找原因?

编辑:更多信息

刚刚又发生了,在类似的情况下。

经过 3.5 小时的繁重程序后:砰!

我当时确实有一个“顶部”:

top - 15:26:41 up  4:26,  4 users,  load average: 2.67, 2.38, 2.37
Tasks: 246 total,   3 running, 243 sleeping,   0 stopped,   0 zombie
Cpu(s): 48.2%us,  1.5%sy,  0.0%ni, 48.4%id,  1.1%wa,  0.0%hi,  0.9%si,  0.0%st
Mem:   8252304k total,  8192272k used,    60032k free,    23592k buffers
Swap: 10354680k total,   146024k used, 10208656k free,  6350148k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
 3934 pstanton  20   0 1881m 322m 3900 S 99.5  4.0 141:57.88 java
 3894 pstanton  20   0 1881m 336m 3896 S 95.2  4.2 169:54.01 java
 3914 pstanton  20   0 1881m 315m 3936 S 84.6  3.9 151:52.13 java
 3875 pstanton  20   0 1881m 271m 3948 S 73.3  3.4 179:25.13 java
 3893 pstanton  20   0  317m 208m 206m S 31.2  2.6  33:22.98 postgres
 3932 pstanton  20   0  317m 208m 206m S 16.9  2.6  63:02.05 postgres
 3912 pstanton  20   0  317m 208m 206m R  6.6  2.6  43:27.91 postgres
 4292 pstanton  20   0  325m  13m 4032 S  1.3  0.2   0:00.37 postgres
 4288 pstanton  20   0  325m  22m  12m S  0.7  0.3   0:03.45 postgres
   59 root      15  -5     0    0    0 S  0.3  0.0   0:03.81 ata/1
  358 root      15  -5     0    0    0 S  0.3  0.0   0:04.54 kjournald2
 1585 root      20   0  165m 7204 2168 S  0.3  0.1   1:37.06 Xorg
 2002 root      20   0 42192  380  308 S  0.3  0.0   0:04.03 devkit-disks-da
 3968 pstanton  20   0  288m 7280 3760 S  0.3  0.1   0:02.08 gnome-terminal
 4291 pstanton  20   0  325m  13m 4076 S  0.3  0.2   0:01.41 postgres
 4337 pstanton  20   0 15036 1244  848 R  0.3  0.0   0:00.09 top
    1 root      20   0  4056  596  492 S  0.0  0.0   0:00.91 init

我知道我正在使用交换内存,这并不好,但这不应该停止服务器吗?

另外,这次我已经插入了键盘、鼠标和显示器,并且键盘和鼠标都有电,但显示器却是空白的(甚至没有光标)。

答案1

我认为您需要进入 BMC 来获取硬件的错误日志,或者您需要运行 IBM Director。
此外,如果您的服务器中有 RSA 卡,您可以访问 RSA 卡的网页,它会显示上次检测到的硬件错误。

答案2

系统错误日志应该会告诉您发生了什么;不过,我倾向于提出保修故障并让 IBM 解决 - 尽管您可能需要在受支持的操作系统上重现该问题,他们才会认真对待您。

答案3

这可能是由于 Fedora 的二进制文件不好造成的。此后,我们又安装了另外 2 个操作系统,没有任何问题。谢谢您的回答。

相关内容