我如何运行多个并行 shell 作业并同时监控它们所有？

Question 1

关于如何做到这一点有什么想法吗？

不。

pv 有 -c 和 -N 选项，可以让你做你想做的事

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

但我不知道如何将该功能应用于多个管道

然而，如果你查看 pv 的手册页，你会看到这个

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

因此，您可以扩展此功能以并行运行多个任务，只要可以在一组小窗口中查看进度即可。我会尝试 Xdialog。

目前，我需要为管道的每个实例提供一个单独的终端窗口

我的主要观点是，您没有必要以交互方式打开大量终端窗口，您可以让一个脚本本身打开大量对话框。

Answer

关于如何做到这一点有什么想法吗？

不。

pv 有 -c 和 -N 选项，可以让你做你想做的事

$ pv -cN source access.log | gzip | pv -cN gzip > access.log.gz
source:  760MB 0:00:15 [37.4MB/s] [=>     ] 19% ETA 0:01:02
  gzip: 34.5MB 0:00:15 [1.74MB/s] [  <=>  ]

但我不知道如何将该功能应用于多个管道

然而，如果你查看 pv 的手册页，你会看到这个

          (tar cf - . \
           | pv -n -s $(du -sb . | awk '{print $1}') \
           | gzip -9 > out.tgz) 2>&1 \
          | dialog --gauge 'Progress' 7 70

因此，您可以扩展此功能以并行运行多个任务，只要可以在一组小窗口中查看进度即可。我会尝试 Xdialog。

目前，我需要为管道的每个实例提供一个单独的终端窗口

我的主要观点是，您没有必要以交互方式打开大量终端窗口，您可以让一个脚本本身打开大量对话框。

Question 2

您看过--pipeGNU Parallel 吗？

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

（为了强调，加上了猫）

其默认块大小为 1 MB，可以使用 --block 进行调整。

-- 编辑为 1-1 对应关系 --

基于上述内容，您可以获得如下的 1-1 对应关系：

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

（为了强调，加上了猫）

它不是最理想的，因为内部并行不知道其兄弟节点，因此可能在服务器 1 上比在服务器 2 上产生更多。避免这种情况的一种方法是在外部并行上使用 -j1，但如果内部并行只有足够第一台服务器使用的块，那么这不是最佳选择。换句话说：为了完美平衡您的工作负载，您可能需要对此进行一些调整 - 甚至可能使用 --load 100% 或类似选项。

--- 编辑：处理崩溃 ---

如果process_pipe返回错误，则应再重试该命令 2 次：

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

Answer

您看过--pipeGNU Parallel 吗？

cat bigfiles* | pv | parallel --pipe -S server1,server2 'cat | process_pipe'

（为了强调，加上了猫）

其默认块大小为 1 MB，可以使用 --block 进行调整。

-- 编辑为 1-1 对应关系 --

基于上述内容，您可以获得如下的 1-1 对应关系：

parallel --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

（为了强调，加上了猫）

它不是最理想的，因为内部并行不知道其兄弟节点，因此可能在服务器 1 上比在服务器 2 上产生更多。避免这种情况的一种方法是在外部并行上使用 -j1，但如果内部并行只有足够第一台服务器使用的块，那么这不是最佳选择。换句话说：为了完美平衡您的工作负载，您可能需要对此进行一些调整 - 甚至可能使用 --load 100% 或类似选项。

--- 编辑：处理崩溃 ---

如果process_pipe返回错误，则应再重试该命令 2 次：

parallel --retries 3 --eta "cat {} | parallel --pipe -S server1,server2 'cat | process_pipe' > {}.out" ::: bigfiles*

我如何运行多个并行 shell 作业并同时监控它们所有？

答案1

答案2

相关内容