NVIDIA GRID驱动安装:https://docs.nvidia.com/grid/latest/grid-vgpu-user-guide/index.html#installing-vgpu-drivers-linux
在我工作的环境中,我们有多个配备 Tesla 卡的主机,每个主机都为客户端虚拟机提供 vGPU 切片,但具有少量不同版本的 NVIDIA GRID 驱动程序。我们自动安装 NVIDIA GRID 驱动程序,但我希望从“一刀切”(选择安装大多数驱动程序并手动修复差异)转向完全自动化的解决方案。
我在 NVIDIA 文档中找不到如何查询主机以确定该版本应该是什么。看起来应该通过lspci
、dmesg
、 或nvidia-smi
工具。但:
# lspci|grep VGA
02:00.0 VGA compatible controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
那里没有任何线索。dmesg
仅在模块加载成功时才告诉您版本,即版本匹配;并nvidia-smi
告诉我们那里不是任何卡,直到版本匹配为止。
是否向客户提供了一些信息,或者这是一个失败的原因? (即告诉主机维护者使用单一一致的版本)