用于管理/测试远程机器集群上的代码的应用程序

用于管理/测试远程机器集群上的代码的应用程序

(不确定这是否是正确的群组)

我遇到过这种情况:我有许多要创建/构建的应用程序。这些应用程序会随着时间推移而变化,因此需要进行测试。我有许多分布式测试服务器,因此我可以在不同的测试箱上并行测试这些应用程序。

我面临的情况是,我们可能有大约 200-300 个独立的应用程序需要迭代运行/测试,每次运行可能需要大约 1-2 小时。

我正在寻找某种应用程序,它允许我创建批处理/作业类型的流程,其中每个批处理/作业包含要运行的应用程序,然后我可以根据需要安排批处理运行。然后,当机器准备好运行下一个批处理/作业时,该流程将让客户端机器请求运行批处理/作业。

我搜索了常用的 Sourceforge/Freshmeat,也查看了一些 globus/cluster 管理类应用程序。还没有找到任何接近我想要的东西。

想法/评论将会很有帮助。

谢谢

答案1

建造机器人是一个自动化编译/测试周期的系统。Buildbot 支持机器集群。

答案2

这个问题有很多答案。但请记住,所有答案都需要您编写一些脚本并进行自定义。

alvosu 关于使用 Buildbot 的建议非常好,你一定要先看看。我能想到的其他一些想法包括:

分布式哈德森值得研究。Hudson 是当今每个人都在使用的标准持续集成框架,您可以在一组机器上分配它的工作。

您提到您已经看过集群管理软件,这是另一个受欢迎的选择,尽管需要更多设置。例如,一个有趣的方法是设置一个ROCKS 集群并使用其默认的远程执行引擎 SGE 在构建主机上启动作业。

我个人目前对使用GNU 并行作为一个简单的排队系统

相关内容