我在我的机器上运行了一系列模拟。经过几个小时的正常工作后,突然我无法再使用 GPU。老实说,我不知道从哪里开始寻找问题,因为从那时起我就没碰过这台机器。
运行nvidia-smi
结果报错:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
事实上,我已经安装了驱动程序,并且一直在使用它们,直到前一天晚上(晚上一切都停止工作了)。我试过简单地重新启动机器,但没有帮助。有什么想法我可以检查什么吗?
我有 Ubuntu 18.04.4 LTS。运行lspci -k | grep -EA3 'VGA|3D|Display'
结果为:
17:00.0 VGA compatible controller: NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] (rev a1)
Subsystem: ASUSTeK Computer Inc. GP102 [GeForce GTX 1080 Ti]
Kernel modules: nvidiafb, nouveau
17:00.1 Audio device: NVIDIA Corporation GP102 HDMI Audio Controller (rev a1)
--
65:00.0 VGA compatible controller: NVIDIA Corporation GP102 [TITAN Xp] (rev a1)
Subsystem: NVIDIA Corporation GP102 [TITAN Xp]
Kernel modules: nvidiafb, nouveau
65:00.1 Audio device: NVIDIA Corporation GP102 HDMI Audio Controller (rev a1)
谢谢你,G。