直接切片字节来分割大文件是否安全？

Question

您可以在任意字节点分割二进制文件。

如果您要拆分文本文件，您仍然可以在任何字节点拆分它，但最终可能会在多字节 Unicode 字符的中间进行拆分。但是，如果您在尝试解释其内容之前连接了文件，那么这将不是问题。（在尝试处理二进制文件的内容之前，您还必须连接二进制文件的各个部分，因此没有区别。）

请注意，像在 Python 代码中那样使用可变位数的输出片段意味着您无法使用简单的内容cat myBigFile.tar.gz.*.part来重构原始内容。（对于 26 个零件，您将按顺序获得 1、10、11、12 … 19、2、20、21 … 26、3、4、5、6、7、8、9。）

以下是我如何myBigFile.tar.gz使用您自己的命名约定分割成 2GB 的部分：

split --bytes=2G --numeric-suffixes=1 --suffix-length=2 --additional-suffix=.part myBigFile.tar.gz myBigFile.tar.gz.

man split有关命令行开关的详细信息，请参阅参考资料。

输出文件示例：

myBigFile.tar.gz.01.part
myBigFile.tar.gz.02.part
myBigFile.tar.gz.03.part
…

获得这些文件后，您可以使用简单的命令和 shell 通配符来重建原始文件：

cat myBigFile.tar.gz.??.part >myBigFile.tar.gz

Answer 1