我在 AWS 中配置了一个带有 GPU 的 Kubernetes 集群,其中一个步骤是配置节点以默认启用 Nvidia 运行时。
因此,当我配置集群自动缩放器时,集群成功扩展,但仍需要配置新节点以使用 Nvidia 作为默认运行时。
我的目标是自动配置这一步,我想知道是否有办法用 Kubernetes 来做到这一点,比如在实例组中指定启动时执行的命令。(就像在 GCP 中您可以定义启动脚本或在 AWS 中称为用于启动脚本的用户数据)。
谢谢!
答案1
我发现了一个有趣的资源这里这帮助我实现了上述目标。
因此可以在实例组配置中定义额外的用户数据部分。
就我而言,我即将启用 Nvidia 运行时,具体实现如下:
spec:
additionalUserData:
- content: |
#!/bin/sh
sudo sed -i '2i "default-runtime": "nvidia",' /etc/docker/daemon.json && sudo systemctl restart docker
name: script.sh
type: text/x-shellscript