我正在尝试重置仍占用内存但没有进程使用它的 NVIDIA A100 卡。首先,我使用任何 NVIDIA 卡杀死了所有进程
sudo fuser -k /dev/nvidia*
然后运行重置命令
sudo nvidia-smi -r
然而,它告诉我,仍然有进程使用 GPU。当我运行时sudo fuser -v /dev/nvidia*
,它会列出一些gpustat
进程nvidia-smi
及其 PID。但是,ps aux | grep $PID
不会返回任何内容(grep
进程本身除外)并sudo kill $PID
产生kill: ($PID): No such process
.lsof
向我展示了相同的不存在的进程。
为什么记录中仍然存在明显不再存在的进程以及如何删除它们?