新的 AMD 系统随机崩溃/内核崩溃

新的 AMD 系统随机崩溃/内核崩溃

大约一年前,我购买了一台基于threadripper的台式计算机,其硬件详细信息如下:

Samsung 970 EVO Plus 500GB - Solid state drive
ASRock X399M TAICHI (latest firmware)
Gigabyte Radeon RX 580 GAMING 4GB
AMD Ryzen Threadripper 2950X - Processor
Corsair Vengeance LPX (32GB)

我最近一直在这台机器上使用 NixOS,之前使用 Arch。该系统的当前配置是:

Linux quasar-nixos-tr 5.4.6 #1-NixOS SMP Sat Dec 21 10:05:23 UTC 2019 x86_64 GNU/Linux

但是,这个系统远不稳定。它经常崩溃,出现硬死机,除了硬关机外没有其他恢复方法。切换到 tty 也不起作用,我也无法通过 ssh 进入这台机器。

我非常感激任何关于如何修复此问题的提示。向此系统发出poweroffandreboot也经常会导致内核崩溃,我设法捕获了其中一个: https://i.stack.imgur.com/nEVKC.jpg

我还运行了内存测试,结果显示内存没有问题。对日志进行分类到目前为止也没有发现任何问题。


目前已检查的内容:

  • rdrand 错误:我的系统不受影响

我已经放弃了。2950x 在 Linux 上根本行不通。我做了以下事情:

  • 我对处理器进行了退货处理,并且系统稳定运行了几个星期,但又再次出现反复崩溃的情况。
  • 我尝试更改 BIOS 中的电源设置,但无济于事。
  • 我最终卖掉了处理器,买了一台 3950X。这对我来说意味着相当大的经济损失。

我现在确实有一个稳定的系统,而且我认为我现在的系统至少与以前的 TR 系统一样具有性能。

相关内容