Fuser 显示不存在的进程,因此 NVIDIA GPU 重置失败

Fuser 显示不存在的进程,因此 NVIDIA GPU 重置失败

我正在尝试重置仍占用内存但没有进程使用它的 NVIDIA A100 卡。首先,我使用任何 NVIDIA 卡杀死了所有进程

sudo fuser -k /dev/nvidia*

然后运行重置命令

sudo nvidia-smi -r

然而,它告诉我,仍然有进程使用 GPU。当我运行时sudo fuser -v /dev/nvidia*,它会列出一些gpustat进程nvidia-smi及其 PID。但是,ps aux | grep $PID不会返回任何内容(grep进程本身除外)并sudo kill $PID产生kill: ($PID): No such process.lsof向我展示了相同的不存在的进程。

为什么记录中仍然存在明显不再存在的进程以及如何删除它们?

相关内容