因此,我在一个相当新的台式机上运行 Ubuntu 22.04.1(规格如下)。自安装以来,总是会出现一些轻微的冻结,但只要重新启动或重新安装 Nvidia 驱动程序即可解决。然而,几天前,当我在它顺利运行了一周多之后关闭它时,问题变得更加严重。目前它几乎无法使用;桌面会随机冻结,有时在重新启动后立即冻结,有时在几个小时后冻结。当这种情况发生时,系统完全没有响应。
需要注意的是,在关闭之前(由于后台进程占用了太多的 RAM 和交换空间,我关闭了),我运行了swapoff
,但在它完成之前就中断了它。我不确定这是否会导致我现在遇到的问题。
我迄今为止尝试过的事情
发生这种情况后,我读了
/var/log/syslog
几遍,没有发现任何特别之处,因为每次看起来都有点不同,并且没有显示明显的错误消息。SysRq 键从来没有起作用过。
我尝试在空的 SSD(之后
nvme format
)和 HDD 上重新安装 Ubuntu 22.04.1,但都没有帮助。除了HDD 上的 3 个错误外,
smartctl
和实用nvme
程序没有报告任何严重的磁盘错误。UNC
禁用
iommu
不会影响任何东西。memtester
使用 30 GB RAM 进行测试没有报告任何错误。当发生冻结时,
free -m
、sensors
、top
或nvidia-smi
(当我安装了驱动程序时)不会显示任何异常活动(温度低等)。即使只有默认的 GPU 驱动程序(nouveau
),问题仍然存在。一开始从实时 USB 启动相对稳定,但现在也出现了同样的情况。我尝试过 22.04.1 和 20.04.5。
完全移除显卡不会改变任何东西。
这可能与,拆下 CPU 冷却器后,我发现冷却器和处理器之间有一层本该拆下的塑料薄膜(这台电脑是由当地一家五金店组装的),所以基本上 CPU 已经运行了将近一年,没有得到适当的冷却。在此之前,CPU 温度持续保持在~90 C如 BIOS 中所述。移除后,温度显著下降(降至 ~40 C),但冻结情况似乎没有改变。
眼镜
主板:华硕 TUF Gaming H670-Pro Wifi D4
处理器:Intel i9-12900K
GPU:RTX-3070Ti(制造商 Zotac)
内存:16GB x 2 DDR4 2667MHz(XPG)
贮存:
- WD Black SN750 SE 1TB SSD
- 希捷 Barracuda 2TB 硬盘
我认为这是硬件问题,但我不确定诊断问题的下一步是什么。欢迎提出任何想法或意见。
答案1
关于硬件问题,我刚刚查了一下,你的 CPU 的最高温度约为 100°C。因此理论上不应该有物理损坏,但考虑到它已经使用一年,温度一直保持在 90°C 左右 - 我不会忽视硬件损坏的可能性。
在您尝试了所有方法之后,我唯一的猜测是问题出在 Wayland(如果您正在使用它)。因此,如果您正在使用 Wayland,请在登录屏幕上选择您的用户并单击右下角的齿轮图标,切换到 XOrg。选择 XOrg。
另外,冻结时间有多长?如果冻结时间很短,请尝试Full composition pipeline
在 Nvidia 设置中启用。我相信它位于“显示”或类似位置。转到高级选项。在那里,启用完整的合成管道并保存到 X 配置文件(为此,您需要从终端以 sudo 身份运行该应用程序)。这实际上对我没有帮助,但我听说它应该有助于解决屏幕撕裂和轻微冻结问题,所以如果冻结不严重,你应该试一试。