如何并行化dd？

Question 1

在 Bash 中测试：

INFILE=in
seq 0 1000 $((`stat --format %s $INFILE` /100000 )) |
  parallel -k dd if=$INFILE bs=100000 skip={} conv=sparse seek={} count=1000 of=out

您可能需要调整 1000。

Answer

在 Bash 中测试：

INFILE=in
seq 0 1000 $((`stat --format %s $INFILE` /100000 )) |
  parallel -k dd if=$INFILE bs=100000 skip={} conv=sparse seek={} count=1000 of=out

您可能需要调整 1000。

Question 2

即将出现一个自定义的、未经测试的代码片段：

dd if=oldf conv=sparse bs=1k                 count=3000000000                 of=newf &
dd if=oldf conv=sparse bs=1k skip=3000000000 count=3000000000 seek=3000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=6000000000 count=3000000000 seek=6000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=9000000000 count=3000000000 seek=9000000000 of=newf &
wait

这应该在逻辑上将文件划分为四个 3TB 的块并并行处理它们。（skip=跳过输入块；seek=查找输出块。）当然，第四个命令将读取到旧文件的末尾，因此该count=参数并不是绝对必要的。

Answer

即将出现一个自定义的、未经测试的代码片段：

dd if=oldf conv=sparse bs=1k                 count=3000000000                 of=newf &
dd if=oldf conv=sparse bs=1k skip=3000000000 count=3000000000 seek=3000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=6000000000 count=3000000000 seek=6000000000 of=newf &
dd if=oldf conv=sparse bs=1k skip=9000000000 count=3000000000 seek=9000000000 of=newf &
wait

这应该在逻辑上将文件划分为四个 3TB 的块并并行处理它们。（skip=跳过输入块；seek=查找输出块。）当然，第四个命令将读取到旧文件的末尾，因此该count=参数并不是绝对必要的。

如何并行化dd？

答案1

答案2

相关内容