我有一台小型无头服务器,运行 Ubuntu 18.04。一段时间后(例如一两天),服务器变得无响应;按下电源按钮时,无 SSH 访问、无 ping 响应、无磁盘活动,必须按住该按钮才能关闭服务器。
当服务器正常运行并按下电源按钮时,磁盘活动会正常关闭。所以我认为这是一次相当严重的崩溃,而不仅仅是网卡无响应。
我对系统日志的了解有限,似乎根本没有显示任何错误。我已经设置并验证了内核崩溃转储机制正在运行,但什么也没产生。
调试此问题时我下一步应该做什么?
系统规格(如果相关):
- AMD Ryzen 3 1200(4 核,4 线程,3.1GHz)
- Asrock AB350 Gaming-ITX/AC
- 1 个 16GB DDR4-2666 CL19椭圆曲线(已验证以 ECC 形式运行)
- Nvidia GeForce GT 710(使系统启动 - CPU 没有 IG)
- 1x 250GB Crucial MX500 250GB 3D NAND M.2 Type 2280 内置 SSD(启动和系统磁盘)
- 2x 4TB TOSHIBA HDWQ140,软件 RAID 1(镜像,30 分钟后关闭以节省电量)
非常感谢您的任何建议。