耳语.cpp 需要很长时间才能启动。这可以避免吗？

Question

如果启动该工具不是 cpu 瓶颈（如果是单线程则不可能），那么您可以通过以下方式并行化它

ls *.wav|\
sed 's/\.wav$//g'|\
xargs -P 8 -n 1 --replace='{}' bash -c 'whisper {}.wav > {}.txt'

请注意，这不是魔法，所有符号都有它们的含义，这些都是简单的含义，我很乐意写在右侧的空白处，不幸的是，即使我可以这样做，也没有足够的地方。

该脚本将 an 的输出放入ls *.wav并调用while thing.wav > thing.txt- 但是，它会始终有 8 个whisper进程并行运行。

当然，如果whisper在所有 CPU 核心上进行硬计算，那么它将无法工作 - 除非启动速度很慢，计算本身还没有完成。

您还说该工具需要一些 GB RAM，显然如果您只有 8 GB，那么您不应该同时执行需要 8x3GB 的进程。但如果您有 32 GB RAM，那么您可以通过同时执行 8 x 1GB 来获利。

Answer 1

如果启动该工具不是 cpu 瓶颈（如果是单线程则不可能），那么您可以通过以下方式并行化它

ls *.wav|\
sed 's/\.wav$//g'|\
xargs -P 8 -n 1 --replace='{}' bash -c 'whisper {}.wav > {}.txt'

请注意，这不是魔法，所有符号都有它们的含义，这些都是简单的含义，我很乐意写在右侧的空白处，不幸的是，即使我可以这样做，也没有足够的地方。

该脚本将 an 的输出放入ls *.wav并调用while thing.wav > thing.txt- 但是，它会始终有 8 个whisper进程并行运行。

当然，如果whisper在所有 CPU 核心上进行硬计算，那么它将无法工作 - 除非启动速度很慢，计算本身还没有完成。

您还说该工具需要一些 GB RAM，显然如果您只有 8 GB，那么您不应该同时执行需要 8x3GB 的进程。但如果您有 32 GB RAM，那么您可以通过同时执行 8 x 1GB 来获利。

相关内容