在过去两个月里,我的电脑有几次随机死机。我使用 Linux,电脑是台式电脑,配有 AMD Ryzen CPU、ASUS Prime 主板和 Nvidia 显卡。以下是发生的情况:
- 我正在正常工作,屏幕突然变黑,几秒钟后,出现“无 HDMI 信号”
- 计算机仍处于打开状态,我可以看到灯光,听到台式机箱内风扇运转的声音
- 显然,我无法用键盘做任何事情(我试过 Magic-SysRq 等)
- 我无法使用电源按钮关闭电脑。无论我按下它两秒、十秒还是三十秒。我只能使用背面的开关切断电源才能再次打开它
- 重启后,我在系统日志(systemd)中看不到任何有意义的内容,或者至少我不知道要搜索什么
除了 VirtualBox 正在运行之外,这两次发生的情况我没有发现任何共同模式。一年中的这个时候,这里的温度仍然不是很高。
我想知道如何排除故障,首先要知道这是软件问题还是硬件故障。但现在,我毫无头绪。
任何帮助,将不胜感激。
答案1
听起来这可能是硬盘问题。对硬盘运行 SMART 测试。如果您的系统仍在运行,则可能是硬盘上有坏扇区。
因此,您可以运行一个简短的命令来进行快速检查:
sudo smartctl -i /dev/sda (or whatever your real HD dev path is)
我以前也遇到过同样的问题,遗憾的是现在仍然如此,因为我没有更换坏的硬盘。但就我而言,出于某种奇怪的原因,冻结发生在夜间,很少在中午发生。由于我的服务器冻结,登录屏幕光标停止闪烁,强制重启时 - journalctl 显示大量硬盘错误。
因此,在您的高清电视上设置 SMART 监控也许是个好主意,这样就不会再发生这种情况了 -https://linuxman.co/linux-server/staying-up-to-date-with-your-hard-drive-with-smartmon-tools/