我订购了带有 AMD Ryzen x1700 的专用服务器,在这里安装了 Ubuntu 18.04
Kernel is 4.15.0-29-generic
有 2x500SSD 和 1x4000HDD,它们已安装并正在运行。RAM 64GB。
root@159:~# fdisk -l
Disk /dev/sda: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0xf3b7577b
Device Boot Start End Sectors Size Id Type
/dev/sda1 2048 67110911 67108864 32G 82 Linux swap / Solaris
/dev/sda2 67110912 68159487 1048576 512M 83 Linux
/dev/sda3 68159488 1000213167 932053680 444.4G 83 Linux
Disk /dev/sdb: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/sdc: 3.7 TiB, 4000787030016 bytes, 7814037168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
root@159:~# 免费
total used free shared buff/cache available
Mem: 65985312 1111648 63810352 31760 1063312 64219256
Swap: 33554428 0 33554428
过去一周内,系统每天会持续冻结 1-3 次。 syslog/dmesg 中没有任何可疑信息。 上次发生这种情况时,日志屏幕(上次 - 没有任何信息): http://prntscr.com/kjd2wl 只是冻结,并且直到硬重启才可访问。
我通过 fsck -f 检查了硬盘,一切正常。
CPU 和硬盘的温度都很好,服务器没有负载。不知道还要检查什么。我已经在那里读了很多主题,但没有一个适合我,所有主题都是旧的或针对较旧版本的内核/ubuntu。
答案1
问题解决了。我订购了完整的硬件检查,主机提供商也给我发了评论。
亲爱的客户,
不幸的是,您的服务器在硬件检查时崩溃了,所以我们决定更换服务器,但重新连接旧驱动器。
之后我们检查了您的驱动器,发现您的 4 TB 驱动器已损坏并且无法再启动。因此请确认驱动器是否丢失了数据。
您的服务器现已启动到救援系统。
我会尝试使用新的硬件,如果问题仍然存在,我会告知。
答案2
工作了两天后,服务器在安装新硬盘后再次死机。现在他们修复了 BIOS,服务器可以连续运行两天,没有死机。成功了吗?