Ubuntu 服务器自发重启

Ubuntu 服务器自发重启

我有两台 ubuntu 12.04 服务器(xeon e3)。有时(几天)每台服务器都会自动重启。硬盘和其他硬件都正常。

哪个日志文件可以帮助找出问题的原因?

更新。

硬件:xeon e3 处理器、英特尔服务器主板、32gb ddr3 ecc、系统的 mdadm 镜像 hdd raid、数据库(postgres)的 mdadm ssd raid。

两台服务器都有类似(不完全相同)的组件。Smart 没问题。问题似乎出在软件上。这两台服务器上正在运行 Python 进程和数据库。

Syslog(重启时间):

Aug 23 13:42:23 xeon hddtemp[1411]: /dev/sdc: WDC WD15NPVT-00Z2TT0: 34 C
Aug 23 13:42:23 xeon hddtemp[1411]: /dev/sdd: WDC WD15NPVT-00Z2TT0: 34 C
Aug 23 13:43:24 xeon hddtemp[1411]: /dev/sdc: WDC WD15NPVT-00Z2TT0: 34 C
Aug 23 13:43:24 xeon hddtemp[1411]: /dev/sdd: WDC WD15NPVT-00Z2TT0: 34 C
Aug 23 13:44:14 xeon sensord: Chip: acpitz-virtual-0
Aug 23 13:44:14 xeon sensord: Adapter: Virtual device
Aug 23 13:44:14 xeon sensord:   temp1: 27.8 C
Aug 23 13:44:14 xeon sensord:   temp2: 29.8 C
Aug 23 13:44:14 xeon sensord: Chip: coretemp-isa-0000
Aug 23 13:44:14 xeon sensord: Adapter: ISA adapter
Aug 23 13:44:14 xeon sensord:   Physical id 0: 37.0 C
Aug 23 13:44:14 xeon sensord:   Core 0: 37.0 C
Aug 23 13:44:14 xeon sensord:   Core 1: 37.0 C
Aug 23 13:44:14 xeon sensord:   Core 2: 37.0 C
Aug 23 13:44:14 xeon sensord:   Core 3: 37.0 C
Aug 23 13:44:24 xeon hddtemp[1411]: /dev/sdc: WDC WD15NPVT-00Z2TT0: 34 C
Aug 23 13:44:24 xeon hddtemp[1411]: /dev/sdd: WDC WD15NPVT-00Z2TT0: 34 C
Aug 23 13:47:01 xeon kernel: imklog 5.8.6, log source = /proc/kmsg started.
Aug 23 13:47:01 xeon rsyslogd: [origin software="rsyslogd" swVersion="5.8.6" x-pid="582" x-info="http://www.rsyslog.com"] start
Aug 23 13:47:01 xeon rsyslogd: rsyslogd's groupid changed to 103
Aug 23 13:47:01 xeon rsyslogd: rsyslogd's userid changed to 101
Aug 23 13:47:00 xeon rsyslogd-2039: Could not open output pipe '/dev/xconsole' [try http://www.rsyslog.com/e/2039 ]
Aug 23 13:47:01 xeon kernel: [    0.000000] Initializing cgroup subsys cpuset
Aug 23 13:47:01 xeon kernel: [    0.000000] Initializing cgroup subsys cpu
Aug 23 13:47:01 xeon kernel: [    0.000000] Initializing cgroup subsys cpuacct
Aug 23 13:47:01 xeon kernel: [    0.000000] Linux version 3.11.0-26-generic (buildd@komainu) (gcc version 4.6.3 (Ubuntu/Linaro 4.6.3-1ubuntu5) ) #45~precise1-Ubuntu SMP Tue Jul 15 04:02:35 UTC 2014 (Ubuntu 3.11.0-26.45~precise1-generic 3.11.10.12)
Aug 23 13:47:01 xeon kernel: [    0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-3.11.0-26-generic root=UUID=0daa7f53-6c74-47d2-873e-ebd339cd39b0 ro splash quiet vt.handoff=7
Aug 23 13:47:01 xeon kernel: [    0.000000] KERNEL supported cpus:
Aug 23 13:47:01 xeon kernel: [    0.000000]   Intel GenuineIntel
Aug 23 13:47:01 xeon kernel: [    0.000000]   AMD AuthenticAMD
Aug 23 13:47:01 xeon kernel: [    0.000000]   Centaur CentaurHauls
Aug 23 13:47:01 xeon kernel: [    0.000000] e820: BIOS-provided physical RAM map:
Aug 23 13:47:01 xeon kernel: [    0.000000] BIOS-e820: [mem 0x0000000000000000-0x000000000009bbff] usable
Aug 23 13:47:01 xeon kernel: [    0.000000] BIOS-e820: [mem 0x000000000009bc00-0x000000000009ffff] reserved

Dmseg——没什么奇怪的。

答案1

这说明硬件出了问题。如果您遇到了软件问题,并且软件导致重新启动,那么您会收到有关该问题的一些日志数据。即使在内核崩溃的情况下,您也会在某个地方(可能是 dmesg)写入一些日志数据。日志中显然没有任何内容,它们只是结束并重新启动。

没有日志数据意味着您的系统无法将任何内容写入磁盘。这意味着以下两种情况之一:您的硬盘不可用,或者您的系统突然断电。

检查服务器是否有足够的电源。如果有 UPS,请确保它们没问题。当多台服务器同时出现此问题时,这通常是故障点。

相关内容