安装无盘环境的 NVIDIA 驱动程序

安装无盘环境的 NVIDIA 驱动程序

我正在尝试设置一个由 8 台计算机和一个主文件服务器组成的集群。理想情况下,我希望在 pxe-boot、准无盘/准无状态环境中进行设置(即唯一的本地存储是/var,扭矩配置等内容将存放在那里)。8 个计算节点中的每一个都有 4 个 NVIDIA Tesla K40m,但根文件服务器没有 GPU。

理想情况下,我希望能够在文件服务器(位于/node)上创建完整安装,然后通过 PXE 启动将其引导至计算节点,但我还没有找到在没有板载 NVIDIA GPU 的情况下安装 NVIDIA 驱动程序的方法。我发现NVIDIA 论坛上的一个问题关于某人如何尝试此操作但未成功...

或者,我可以将 NVIDIA 驱动程序安装到其中一个计算节点(例如,一个当前在其本地磁盘上运行 CentOS)/usr/local/nvidia并跟踪它创建的文件并创建该 tarball 以复制到文件服务器安装。

最后,我可以只维护八个独立的安装,但是,从长期维护的角度来看,我不喜欢这样(每个计算节点都将运行扭矩作业,因此我希望节点看起来或多或少相同)。

总而言之,我的要求是这样的:

  1. 我可以在没有 NVIDIA GPU 的情况下安装 NVIDIA 驱动程序吗?
  2. 我还有什么其他方法可以解决这个问题吗?

作为参考,我们正在运行 CentOS 7。

[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

答案1

像其他一切一样,使用 RPM 包。

目前最好的建造NVIDIA 驱动程序包来自 Negativo17。

相关内容