我在运行以下硬件的机器上安装了 Ubuntu 17.04 Server:
- 中央处理器:Ryzen 5 1600
- 主板:华硕 Prime A320M-K
- 内存:8 GB DDR4 2133
- 120 GB 固态硬盘
- 4 TB 硬盘
- 550 瓦电源
- LG WH16NS40 蓝光驱动器
我主要用它运行下列操作:
- PLEX媒体服务器
- 远程控制
- 有时使用 MakeMKV 翻录蓝光和 DVD
我遇到的问题是系统有时会完全无响应。无法 ping 通,无法 ssh 登录,plex 离线。我让它恢复的唯一方法是使用机箱上的重启按钮重新启动它。
我所做的大多数故障排除都与硬件有关:
我不认为这是电源问题,因为我在同一个电源电路上有一个 NAS 系统,它已经运行了数周并且很稳定,而最近我不得不每周手动重启这个系统几次。据我所知,PSU 完全不能满足系统的需求。我刚刚订购了一个 Kill A Watt 电力使用监测器来验证,但到目前为止,这似乎不是电源问题,而是系统稳定性问题。
我已经运行了 Memtest86+ 以确保它不是内存。
那么现在,我该如何使用 Ubuntu 来尝试弄清楚发生了什么?
我已开始通过查看 /var/log/systemlog 和 /var/log/kern.log 等日志来排除软件方面的故障,现在我发现了明显的问题。日志在系统停止响应时结束,没有任何明显问题。还有其他日志可以查看吗?有什么好方法可以找出到底出了什么问题?我对排除此类故障还很陌生,希望得到一些建议。
free -h 的输出:
total used free shared buff/cache available
Mem: 7.8G 808M 6.4G 9.4M 610M 6.7G
Swap: 7.9G 0B 7.9G
swapon -s 的输出:
Filename Type Size Used Priority
/dev/dm-1 partition 8318972 0 -1
/etc/fstab 中的内容:
/dev/mapper/plexbox--vg-root / ext4 errors=remount-ro 0 1
# /boot/efi was on /dev/sda1 during installation
UUID=DE7B-3E50 /boot/efi vfat umask=0077 0 1
/dev/mapper/plexbox--vg-swap_1 none swap sw 0 0
UUID=13af9aaa-871d-496e-9775-875cf4303e04 /mnt/media ext4 defaults 0 2
答案1
我已经检查了您的和和terminal
的输出,并没有找到我期望看到的加密交换文件,所以您的问题不存在。free -h
swapon -s
cat /etc/fstab
我确实看到了可能的问题/etc/fstab
。使用以下命令编辑此文件:
在terminal
...
gksudo gedit /etc/fstab
改变这个:
# /boot/efi was on /dev/sda1 during installation
UUID=DE7B-3E50 /boot/efi vfat umask=0077 0 1
对此:
# /boot/efi was on /dev/sda1 during installation
# UUID=DE7B-3E50 /boot/efi vfat umask=0077 0 1
UUID=DE7B-3E50 /boot/efi vfat defaults 0 1
(复制第二行,注释掉第二行,然后编辑新的第三行...这样,如果您需要/想要的话,您可以轻松返回)。
重新启动服务器并监控是否冻结。
故障排除提示:
重启服务器后,登录服务器并输入tail -f /var/log/syslog
并将输出保留在前台。它将向您显示当前/最后写入系统日志的条目,并且可能在系统冻结时(如果仍然冻结)提供有关问题所在位置的一些线索。
答案2
只是想说声谢谢,并补充一下,这对我也有用。我的操作系统安装在较旧的 SSD 驱动器上,运行了一段时间后,它开始冻结。更改 fstab 后,它已经稳定了数周