我在一台机器上安装了 Ubuntu 16.04 桌面版,并通过 ssh 使用它进行研究。
有时机器会随机重启,但我找不到重启的原因。
$ last reboot
reboot system boot 4.4.0-62-generic Wed Feb 8 01:34 still running
reboot system boot 4.4.0-62-generic Mon Feb 6 09:16 still running
reboot system boot 4.4.0-62-generic Sun Feb 5 16:43 still running
reboot system boot 4.4.0-62-generic Sun Feb 5 00:37 still running
我检查了/var/log/syslog
...
Feb 7 23:31:37 niaserver7 systemd[1]: Started Session 77 of user swmo.
Feb 8 00:17:01 niaserver7 CRON[17883]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Feb 8 00:34:07 niaserver7 systemd[1]: Started CUPS Scheduler.
Feb 8 01:17:01 niaserver7 CRON[17893]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Feb 8 01:35:01 niaserver7 rsyslogd: [origin software="rsyslogd" swVersion="8.16.0" x-pid="1315" x-info="http://www.rsyslog.com"] start
Feb 8 01:35:01 niaserver7 systemd-modules-load[538]: Inserted module 'lp'
Feb 8 01:35:01 niaserver7 systemd-modules-load[538]: Inserted module 'ppdev'
Feb 8 01:35:01 niaserver7 kernel: [ 0.000000] Initializing cgroup subsys cpuset
Feb 8 01:35:01 niaserver7 rsyslogd-2222: command 'KLogPermitNonKernelFacility' is currently not permitted - did you already set it via a RainerScript command (v6+ config)? [v8.16.0 try http://www.rsyslog.com/e/2222 ]
Feb 8 01:35:01 niaserver7 systemd-modules-load[538]: Inserted module 'parport_pc'
Feb 8 01:35:01 niaserver7 rsyslogd: rsyslogd's groupid changed to 108
Feb 8 01:35:01 niaserver7 rsyslogd: rsyslogd's userid changed to 104
Feb 8 01:35:01 niaserver7 loadkeys[541]: Loading /etc/console-setup/cached.kmap.gz
Feb 8 01:35:01 niaserver7 kernel: [ 0.000000] Initializing cgroup subsys cpu
Feb 8 01:35:01 niaserver7 systemd[1]: Started udev Kernel Device Manager.
我该如何修复它?
答案1
这听起来像是多种问题的结合。
如果某个系统随机重启,我会将机箱中的电源更换为提供绰绰有余 安培数对于连接的组件(因为您希望它在峰值功率消耗期间保持运行)。
如果整个机架同时重新启动,我会将不合格的 UPS 视为根本原因,或者可能是由于服务器位置的交流电故障导致的过热情况。
多路转换器馈线的间歇性短路也可能导致您所描述的多次重启结果。
答案2
如果您的服务器有 BMC(基板管理控制器),您可以使用以下安装命令检查电源故障:
ipmitool sel 列表|grep -i power
你可以使用以下命令安装 ipmitool
安装 ipmitool
下面是一个示例输出:
4 | 预初始化 |0000000057| 电源单元 #0x3f | 断电/关闭 | 取消断言 d | 预初始化 |0000000021| 电源单元 #0x3f | 断电/关闭 | 取消断言 13 | 预初始化 |0000000022| 电源单元 #0x3f | 断电/关闭 | 取消断言 16 | 2013 年 9 月 12 日 | 14:18:00 | 电源 #0x30 | 检测到存在 | 已断言 17 | 2013 年 9 月 12 日 | 14:18:00 | 电源 #0x31 | 检测到存在 | 已断言
还要确保您已加载 ipmi 的内核模块:
modprobe ipmi_devintf
对于模块加载,您还可以使用 dmesg 命令检查:
dmesg|grep ipmi
答案3
我也遇到了 Ubuntu 随机重启问题。我尝试了以下方法,似乎有效。
- 通过 Live CD 启动 Ubuntu(无需安装)。
- 删除所有分区并使用 Gparted 分区编辑器(系统 -> 管理员)将整个硬盘格式化为 FAT32
- 安装 ubuntu 16.04