我有一个在虚拟机中运行的终端服务器(我不是设置它的人)。我可以使用 Tesla T4 GPU 来运行机器学习。问题是,即使安装了推荐的 nvidia 440 驱动程序,它似乎在与卡通信时存在问题:
user1@server1:~/log$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
但该卡已正确安装,甚至显示在 lspci 中:
02:02.0 3D controller: NVIDIA Corporation TU104GL [Tesla T4] (rev a1)
我尝试重新安装驱动程序并进行更新,但无论哪种方式,驱动程序似乎都无法启动。
诊断该问题有什么好方法?
答案1
问题是,我在虚拟机中工作,而不是在实际的服务器上工作,这需要虚拟化 GPU 的专有虚拟机驱动程序