有没有一种快速的方法来获取大型 TAR 中的最后一个文件？

Question 1

不，很遗憾没有。来自维基百科

与其他存档格式相比，tar 格式的另一个缺点是没有集中存放文件内容信息的位置（一种“目录”）。因此，要列出存档中的文件名称，必须通读整个存档并查找文件开始的位置。此外，要从存档中提取一个小文件，使用 tar 时，必须通读整个存档，查找所需文件的开始位置，而不是像其他存档格式那样在表中查找偏移量并直接转到该位置。对于大型 tar 存档，这会导致很大的性能损失，使得 tar 存档不适合经常需要随机访问单个文件的情况。

Answer

不，很遗憾没有。来自维基百科

与其他存档格式相比，tar 格式的另一个缺点是没有集中存放文件内容信息的位置（一种“目录”）。因此，要列出存档中的文件名称，必须通读整个存档并查找文件开始的位置。此外，要从存档中提取一个小文件，使用 tar 时，必须通读整个存档，查找所需文件的开始位置，而不是像其他存档格式那样在表中查找偏移量并直接转到该位置。对于大型 tar 存档，这会导致很大的性能损失，使得 tar 存档不适合经常需要随机访问单个文件的情况。

Question 2

是的；如果您知道所需文件的大小，则可以使用 dd skip 复制 tar 的末尾。或者，如果您想读取整个文件一次以便以后快速随机访问，则可以使用以下命令创建索引：

tar -tRvf "$TAR"

示例脚本：

#!/bin/bash

#
# tar_extract_via_index.sh
#

TAR="$1"
RE="$2"

if [ ! -f "$TAR" ] ; then
    echo "Not a file $TAR"
    exit 1
fi
if [ "$RE" == "" ] ; then
    echo "Expecting a $RE"
    exit 2
fi
if [ ! -f "$TAR".index ] ; then
    tar -tRvf "$TAR" > "$TAR".index
fi
MATCH="$(grep -P "$RE" "$TAR".index)"
if [ "$(echo "$MATCH" | grep -c .)" != "1" ] ; then
    echo "Multipule matches:"
    echo "$MATCH" | perl -pe 's/^/\t/g' >&2
    exit 3
fi
FILE="$( echo "$MATCH" | perl -pe 's/.* \.\///g;s/.*\///g')"
SKIP="$( echo "$MATCH" | perl -pe 's/:.*//g;s/.* //g')"
COUNT="$(echo "$MATCH" | perl -pe 's/\.\/.*//g;s/.*\/[^ ]+ +//g;s/ .*//g')"
SKIP="$(echo "($SKIP+1)*512" | bc)"
dd if="$TAR" bs=1 status=none skip=$SKIP count=$COUNT of="$FILE"
echo "$FILE"

Answer

是的；如果您知道所需文件的大小，则可以使用 dd skip 复制 tar 的末尾。或者，如果您想读取整个文件一次以便以后快速随机访问，则可以使用以下命令创建索引：

tar -tRvf "$TAR"

示例脚本：

#!/bin/bash

#
# tar_extract_via_index.sh
#

TAR="$1"
RE="$2"

if [ ! -f "$TAR" ] ; then
    echo "Not a file $TAR"
    exit 1
fi
if [ "$RE" == "" ] ; then
    echo "Expecting a $RE"
    exit 2
fi
if [ ! -f "$TAR".index ] ; then
    tar -tRvf "$TAR" > "$TAR".index
fi
MATCH="$(grep -P "$RE" "$TAR".index)"
if [ "$(echo "$MATCH" | grep -c .)" != "1" ] ; then
    echo "Multipule matches:"
    echo "$MATCH" | perl -pe 's/^/\t/g' >&2
    exit 3
fi
FILE="$( echo "$MATCH" | perl -pe 's/.* \.\///g;s/.*\///g')"
SKIP="$( echo "$MATCH" | perl -pe 's/:.*//g;s/.* //g')"
COUNT="$(echo "$MATCH" | perl -pe 's/\.\/.*//g;s/.*\/[^ ]+ +//g;s/ .*//g')"
SKIP="$(echo "($SKIP+1)*512" | bc)"
dd if="$TAR" bs=1 status=none skip=$SKIP count=$COUNT of="$FILE"
echo "$FILE"

Question 3

如果 tar 是在可寻址的存储上创建的，即在硬盘上而不是在磁带上，我们可以有效地查找存档中的最后一个文件。使用 GNU tar 的 -n 或 --seek 选项。（见此GNU tar 选项页面）例如，最后存储的文件名为 last_file.txt ，您可以使用以下命令

tar -nxvf <your_archive> last_file.txt

这将简单地提取 last_file.txt。由于 tar 格式在标头中包含每个文件的大小，因此可以使用 seek 系统调用有效地跳过整个文件（请参阅tar 文件格式）

为了有效地列出大型档案中的所有文件，请使用

tar -ntvf <your_archive>

Answer

如果 tar 是在可寻址的存储上创建的，即在硬盘上而不是在磁带上，我们可以有效地查找存档中的最后一个文件。使用 GNU tar 的 -n 或 --seek 选项。（见此GNU tar 选项页面）例如，最后存储的文件名为 last_file.txt ，您可以使用以下命令

tar -nxvf <your_archive> last_file.txt

这将简单地提取 last_file.txt。由于 tar 格式在标头中包含每个文件的大小，因此可以使用 seek 系统调用有效地跳过整个文件（请参阅tar 文件格式）

为了有效地列出大型档案中的所有文件，请使用

tar -ntvf <your_archive>

有没有一种快速的方法来获取大型 TAR 中的最后一个文件？

答案1

答案2

答案3

相关内容