NVIDIA vGPU VM 如何确定正确的 NVIDIA 网格驱动程序版本?

NVIDIA vGPU VM 如何确定正确的 NVIDIA 网格驱动程序版本?

NVIDIA GRID驱动安装:https://docs.nvidia.com/grid/latest/grid-vgpu-user-guide/index.html#installing-vgpu-drivers-linux

在我工作的环境中,我们有多个配备 Tesla 卡的主机,每个主机都为客户端虚拟机提供 vGPU 切片,但具有少量不同版本的 NVIDIA GRID 驱动程序。我们自动安装 NVIDIA GRID 驱动程序,但我希望从“一刀切”(选择安装大多数驱动程序并手动修复差异)转向完全自动化的解决方案。

我在 NVIDIA 文档中找不到如何查询主机以确定该版本应该是什么。看起来应该通过lspcidmesg、 或nvidia-smi工具。但:

# lspci|grep VGA
02:00.0 VGA compatible controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

那里没有任何线索。dmesg仅在模块加载成功时才告诉您版本,即版本匹配;并nvidia-smi告诉我们那里不是任何卡,直到版本匹配为止。

是否向客户提供了一些信息,或者这是一个失败的原因? (即告诉主机维护者使用单一一致的版本)

相关内容