我想知道是否可以通过终端重置 GPU?为了澄清起见,举个例子,显卡超频过度,重置为性能等级 0,或标准速度的 30% 左右。
重新启动可以解决这个问题,但问题是我通常通过 TeamViewer 远程访问这台机器,并且需要在重置卡时保持连接。
谢谢
答案1
如果您可以使用nvidia-smi
,则可以使用以下方法重置:
sudo nvidia-smi --gpu-reset
或者
sudo nvidia-smi -r
这来自nvidia-smi
帮助:nvidia-smi -h | grep reset
。它应该适用于您的机器。
其他人可能正在使用以下服务器DGX-1。 在这种情况下,你不能重置单个 GPU:
对于 DGX-1 和 DGX-1V 平台,单个 GPU 无法重置,因为它们是通过 nvlink 链接的,所以必须同时重置所有 GPU。
在某些计算集群和 Azure 上的标准 NV6 虚拟机中存在这种情况:
$ sudo nvidia-smi -r
Resetting GPU 00003343:00:00.0 is not supported.