我有一个网格集群。(它正在运行 SGE,但我认为这不相关。)所有机器都旨在能够随时退出并重新运行,而不会出现任何重大问题。
但是,我的用户需要能够运行 cron 作业。目前,他们只是随机挑选一台服务器并在其上执行 cron 作业。我可以为他们分配一个特定的服务器(无论是在网格中还是外部)来运行他们的作业,但这似乎是错误的。
有没有人有解决方案,可以将 crontab 集中存储,但 (可能) 在其他地方运行?还是我只是想太多了?
答案1
为什么不让用户在提交服务器上设置他们的 cron 作业,并让其使用qsub
或qrsh
实际执行他们需要在集群上运行的任务?这难道不是拥有网格/集群的首要意义吗?