如何诊断高负载下的崩溃/重启?

如何诊断高负载下的崩溃/重启?

我最近将我的 PC 升级为相对较新的(但买的是二手的)主板和相对较新的(也是买的二手的)CPU(AMD Ryzen 5 3600),但保留了显卡(Radeon R9 270x)。我全新安装了 Ubuntu 20.04。

现在,PC 在 CPU 和显卡负载过重的情况下崩溃并重启,几乎只在玩游戏时发生(尽管这些游戏都是较老的游戏,PC 应该能够处理)。这种情况通常发生在显卡风扇听起来达到最高转速几分钟后。CPU 和显卡的温度上升到 78-80 °C 左右,但不会更高。我怀疑这是显卡的问题,因为在室内设计/CAD 类程序(Snap 商店的 SweetHome3D)中拖动 3D 对象时也发生过两次这种情况。

但是,我尝试同时stress在所有 CPU 核心/线程上运行 GPU 压力测试 (FurMark) 和命令几分钟(比计算机在游戏中崩溃所需的时间长得多),一切正常。温度再次达到 80°C 左右,所以我认为这不是过热问题。我还将 PSU 升级为 550 W,这应该足够了,但这并没有解决问题。我愿意升级显卡,但考虑到目前的价格(以及我不想要高端游戏机,而只是相对面向未来的升级),我想先排除任何其他问题。

我该如何诊断这个问题?我应该查看哪些日志,游戏和我进行的压力测试之间可能有什么不同?我知道也有类似的问题,但没有一个能真正帮助我找到我遇到的问题。它们要么引用冷冻(无需重启),热问题或者电源故障我认为我已经排除了后两种情况。我还意识到这听起来可能不是针对 Ubuntu 的,但这是我正在运行的系统,我想对其进行诊断。

任何帮助将非常感激!

编辑

以下是 的输出free。有 4 GB 的交换空间。

              total        used        free      shared  buff/cache   available
Mem:           15Gi       2.8Gi        10Gi        34Mi       2.1Gi        12Gi
Swap:         4.0Gi          0B       4.0Gi

编辑2

sudo journalctl -b -1 -e以下是根据用户 waltinator 的要求粘贴的内容:https://pastebin.com/hkpk7BJi

相关内容