systemimager 和 sun grid engine 排队系统

systemimager 和 sun grid engine 排队系统

我即将安装我们的新集群。我已经安装了第一个节点并将其用于黄金映像。作为排队软件,我们使用SGE太阳网格引擎)。安装第一个节点后,我测试了提交qsub和读取队列统计信息qstat。它按预期工作。但是克隆到另一个节点后,SGE 无法工作。我无法启动守护进程。如果我qstat -f经过较长时间后再次尝试,我会看到消息:

"error: unable to send message to qmaster using port 535 on host "myHOST": got send timeout*"

我不确定它从何而来,因为/etc/services两台主机上的防火墙设置相同。另一件事是,新节点的假脱机目录没有创建(这可以理解)。

有人能告诉我如何安装SGE而不systemimager费力吗?我不想通过所有的计算节点来开始./install_execd

相关内容