在执行密集型任务(主要是游戏,但也包括与科学数据分析相关的 GPU 计算)时,我的笔记本电脑会过热并最终由于快速达到高温(三分钟左右超过 90°C)而关闭。我有两个 GPU:整个系统默认使用的集成 Intel 卡,以及仅在需要更多“功率”时才使用的 NVIDIA 独立 GPU(通过主要的)。我的独立 GPU 工作到了极限,但不会过热。仅在使用 NVIDIA GPU 时才会发生。因此,我花了几周的时间来学习如何对我的卡进行降频。
我设法在 nvidia-settings 中启用降频/超频酷比特。然而,我主要面临三个问题:(i)我能够设置的最小偏移是-200 MHz,这还不够。 (ii) 超频在 nvidia-settings powermizer 面板中立即生效,但仅在 P3(具有最高 MHz 值)中生效,而降频则不会。最后,(iii) 我有 4 个 GPUPerfMode(0 到 3),其中三个具有相同的最小值和最大值(请参见此处):
- 0:139-607
- 1:139-1911
- 2:139-1911
- 3:139-1911
因此,为了解决过热问题,我需要对卡进行降频或将 GPUPerfModes 更改为更实际的值,也就是说,坚持令人满意且不会导致极端温度的性能水平。为什么会出现上述问题(i、ii 和 iii)?我的配置文件有问题吗?设置?有任何想法吗?
完整的 nvidia 错误报告:nvidia-bug-report.log.gz(280.2 KB)
眼镜:
- 戴尔 Inspiron 灵越 5480(擎天柱)
- 操作系统:Arch Linux x86_64
- 内核:5.7.12-arch1-1
- 德语:GNOME 3.36.4
- CPU:英特尔 i7-8565U (8) @ 4.600 GHz
- GPU:NVIDIA GeForce MX150(驱动
nvidia 450.57-6
,首先注意到驱动版本问题440.82-3
) - GPU:英特尔超高清显卡 620
答案1
Linux 中 NVIDIA 卡的电源管理非常糟糕,因此最好的选择可能是将 GPU 限制在最低性能水平。
有两种方法可以实现它,要么是一个 X.org 配置文件,您必须为其添加此配置文件(您可能需要重新启动笔记本电脑以查看它是否有效):
Option "Coolbits" "28"
Option "RegistryDwords" "PowerMizerEnable=0x1; PerfLevelSrc=0x2222; PowerMizerLevel=0x3; PowerMizerDefault=0x3; PowerMizerDefaultAC=0x3"
如果它不起作用创建/etc/modprobe.d/nvidia.conf
options nvidia NVreg_RegistryDwords="OverrideMaxPerf=0x1"
并重新启动(RegistryDwords
不再需要 X.org 选项)。
你的表现会很糟糕,但热量应该是一流的。以后请在这里询问 NVIDIA Linux 相关问题:https://forums.developer.nvidia.com/c/gpu-unix-graphics/linux/148