确定性地压缩 .tar.gz 文件

Question 1

好的，所以我认为我终于找到了一种按照我想要的方式获得东西的方法，它涉及分别使用tar和gzip（我使用两个 GNU 工具，tar 1.26 和 gzip 1.6）。

当使用z中的选项时tar，它首先创建 tar 文件，然后立即使用那时间戳来创建 gzip 文件。换句话说，我无法控制中间文件的时间戳（除了更改要存档的原始文件的 mtime 之外，我没有找到任何选项来做到这一点），因此 .tar.gz 文件最终是不确定的。

但是，如果我首先使用不带 gzip 的 tar，然后修改 tar 文件的时间戳（touch例如使用），然后使用 gzip 进行编译，我就会得到确定的结果。

顺便说一句，使用两步过程生成的文件要小得多（在我的示例中约为 400KB，而使用带 z 选项的 tar 时约为 1.2MB）。这一定与单独使用 tar+gzip 和 gzip 时的默认设置有关。由于我的原始文件本来就是空的，我不确定大小减少是否有意义。

无论如何，我的问题的简短答案是：

Answer

好的，所以我认为我终于找到了一种按照我想要的方式获得东西的方法，它涉及分别使用tar和gzip（我使用两个 GNU 工具，tar 1.26 和 gzip 1.6）。

当使用z中的选项时tar，它首先创建 tar 文件，然后立即使用那时间戳来创建 gzip 文件。换句话说，我无法控制中间文件的时间戳（除了更改要存档的原始文件的 mtime 之外，我没有找到任何选项来做到这一点），因此 .tar.gz 文件最终是不确定的。

但是，如果我首先使用不带 gzip 的 tar，然后修改 tar 文件的时间戳（touch例如使用），然后使用 gzip 进行编译，我就会得到确定的结果。

顺便说一句，使用两步过程生成的文件要小得多（在我的示例中约为 400KB，而使用带 z 选项的 tar 时约为 1.2MB）。这一定与单独使用 tar+gzip 和 gzip 时的默认设置有关。由于我的原始文件本来就是空的，我不确定大小减少是否有意义。

无论如何，我的问题的简短答案是：

Question 2

为了能够使用 tar 进行增量备份，某些版本的 tar 会存储文件添加到存档的时间。这可能会导致每次运行测试时输出不同，因此结果似乎不确定。

Answer

为了能够使用 tar 进行增量备份，某些版本的 tar 会存储文件添加到存档的时间。这可能会导致每次运行测试时输出不同，因此结果似乎不确定。

Question 3

正如您所提到的，您需要分别执行 tar 和 gzip 步骤，但是您不需要中间文件，您只需将输入从 tar 传输到 gzip 并在 gzip 中指定 -n 选项即可。从手册页中：此选项会阻止将文件名和时间戳存储在输出文件中。

tar cvf - /path/to/files | gzip -n > archive.tar.gz

在不同时间对同一组文件运行上述命令两次并检查 md5 值。您应该看到两个档案完全相同。

Answer

正如您所提到的，您需要分别执行 tar 和 gzip 步骤，但是您不需要中间文件，您只需将输入从 tar 传输到 gzip 并在 gzip 中指定 -n 选项即可。从手册页中：此选项会阻止将文件名和时间戳存储在输出文件中。

tar cvf - /path/to/files | gzip -n > archive.tar.gz

在不同时间对同一组文件运行上述命令两次并检查 md5 值。您应该看到两个档案完全相同。

相关内容