我在 Amazon Web Services 上运行 Grid Scheduler (fka Sun Grid Engine)。主节点一直在运行,但我想以编程方式将节点添加到集群(也可以删除 - 但删除不是问题)。
我从现有 AMI 启动一个实例;在启动期间,它会将其主机名(例如 ip-10-11-12-13)发布到主节点。因此,如果我手动执行此操作,我会运行qconf -ae
并用主机名填充模板。我还会运行qconf -mconf all.q
并将新主机及其核心数添加到 SLOTS 语句中。
我想我可以建立一个文件并使用qconf -Ae fname
和qconf -Mconf file_list
。有没有办法在不修改 awk/sed 文件的情况下进行此类更新?
编辑:我熟悉 MIT StarCluster;但由于各种原因,我们没有使用它。