我即将安装我们的新集群。我已经安装了第一个节点并将其用于黄金映像。作为排队软件,我们使用SGE
(太阳网格引擎)。安装第一个节点后,我测试了提交qsub
和读取队列统计信息qstat
。它按预期工作。但是克隆到另一个节点后,SGE 无法工作。我无法启动守护进程。如果我qstat -f
经过较长时间后再次尝试,我会看到消息:
"error: unable to send message to qmaster using port 535 on host "myHOST": got send timeout*"
我不确定它从何而来,因为/etc/services
两台主机上的防火墙设置相同。另一件事是,新节点的假脱机目录没有创建(这可以理解)。
有人能告诉我如何安装SGE
而不systemimager
费力吗?我不想通过所有的计算节点来开始./install_execd