假设我们想要使用 GNU 并行将作业分派到一组服务器。如果其中一台服务器在忙于执行作业时死机(电源故障、热关闭...),会发生什么? GNU 并行会只是将相同的作业分派到另一台服务器还是该作业会永远丢失?
答案1
它将永远失去除非--retries
在这种情况下,它将在另一台服务器上重试。另请参阅--filter-hosts
删除已关闭的主机。
答案2
看来我应该更仔细地阅读手册页。我们可以通过保存作业日志文件并从那里恢复来恢复失败的作业,如下所示:parallel --resume-failed --joblog logfile
如果这篇文章对任何人来说没有什么价值,我会删除它。