首先,我在 Z390 A Pro 主板上连接了两个 GTX 1660 Super 并安装了 Ubuntu 22.04。我使用nvidia-smi
和成功超频了这些 GPU nvidia-settings
。
但是在连接第三个GPU(RTX 3060 TI)后我就不能再使用了nvidia-settings
。
当我运行命令时,nvidia-smi
它返回:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.129.06 Driver Version: 470.129.06 CUDA Version: 11.4 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... Off | 00000000:02:00.0 On | N/A |
| 0% 47C P8 16W / 125W | 25MiB / 5943MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
| 1 NVIDIA GeForce ... Off | 00000000:04:00.0 Off | N/A |
| 30% 27C P8 12W / 125W | 1MiB / 5944MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
但是当我运行命令时nvidia-settings
它返回:
(nvidia-settings:2926): GLib-GObject-CRITICAL **: 21:37:24.306: g_object_unref: assertion 'G_IS_OBJECT (object)' failed
** (nvidia-settings:2926): CRITICAL **: 21:37:24.309: ctk_powermode_new: assertion '(ctrl_target != NULL) && (ctrl_target->h != NULL)' failed
** Message: 21:37:24.353: PRIME: No offloading required. Abort
** Message: 21:37:24.353: PRIME: is it supported? no
答案1
我能够很容易地让多张卡在 ubuntu 22.04 中工作,并且能够使用 nvidia-settings 更改设置,这与 Fedora 33/34/35/36 上的相同配置相反,其中 nvidia-smi 可以很好地工作
nvidia-smi -pl 100
nvidia-smi -lgc 1050
但对于内存时钟,您需要使用 nvidia-settings。你用 nvidia-settings 命令了什么?我使用了以下内容(但在 Fedora 上仅应用第一个 GPU - gpu:0 其他忽略)
nvidia-settings -c :0 -a [gpu:0]/GPUMemoryTransferRateOffsetAllPerformanceLevels=2200
nvidia-settings -c :0 -a [gpu:1]/GPUMemoryTransferRateOffsetAllPerformanceLevels=2200
...
但是,当更改配置时,我总是运行
nvidia-xconfig -a --cool-bits=28 --allow-empty-initial-configuration --enable-all-gpus
重新生成xorg.conf,然后启动GUI。如果你只是远程运行它,你可以运行
startx
更改值然后停止它。希望这能给您一些线索。