连接第三个 GPU 后 Nvidia 设置将不起作用

连接第三个 GPU 后 Nvidia 设置将不起作用

首先,我在 Z390 A Pro 主板上连接了两个 GTX 1660 Super 并安装了 Ubuntu 22.04。我使用nvidia-smi和成功超频了这些 GPU nvidia-settings

但是在连接第三个GPU(RTX 3060 TI)后我就不能再使用了nvidia-settings

当我运行命令时,nvidia-smi它返回:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.129.06   Driver Version: 470.129.06   CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:02:00.0  On |                  N/A |
|  0%   47C    P8    16W / 125W |     25MiB /  5943MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   1  NVIDIA GeForce ...  Off  | 00000000:04:00.0 Off |                  N/A |
| 30%   27C    P8    12W / 125W |      1MiB /  5944MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

但是当我运行命令时nvidia-settings它返回:

(nvidia-settings:2926): GLib-GObject-CRITICAL **: 21:37:24.306: g_object_unref: assertion 'G_IS_OBJECT (object)' failed

** (nvidia-settings:2926): CRITICAL **: 21:37:24.309: ctk_powermode_new: assertion '(ctrl_target != NULL) && (ctrl_target->h != NULL)' failed
** Message: 21:37:24.353: PRIME: No offloading required. Abort
** Message: 21:37:24.353: PRIME: is it supported? no

答案1

我能够很容易地让多张卡在 ubuntu 22.04 中工作,并且能够使用 nvidia-settings 更改设置,这与 Fedora 33/34/35/36 上的相同配置相反,其中 nvidia-smi 可以很好地工作

nvidia-smi -pl 100
nvidia-smi -lgc 1050

但对于内存时钟,您需要使用 nvidia-settings。你用 nvidia-settings 命令了什么?我使用了以下内容(但在 Fedora 上仅应用第一个 GPU - gpu:0 其他忽略)

nvidia-settings -c :0 -a [gpu:0]/GPUMemoryTransferRateOffsetAllPerformanceLevels=2200
nvidia-settings -c :0 -a [gpu:1]/GPUMemoryTransferRateOffsetAllPerformanceLevels=2200
...

但是,当更改配置时,我总是运行

nvidia-xconfig -a --cool-bits=28 --allow-empty-initial-configuration --enable-all-gpus

重新生成xorg.conf,然后启动GUI。如果你只是远程运行它,你可以运行

startx

更改值然后停止它。希望这能给您一些线索。

相关内容