所以我有这个 wikipedia 转储,大小约为 10gb,名为“enwiki-latest-pages-articles.xml.bz2”。我一直在终端中尝试以下命令来解压转储:
tar jxf enwiki-latest-pages-articles.xml.bz2
和
tar xvf enwiki-latest-pages-articles.xml.bz2
但它们都返回以下错误
tar: This does not look like a tar archive
tar: Skipping to next header
答案1
您无法使用该tar
命令,因为存档不是 .tar.* 文件。要解压 bzip2 文件,请使用以下命令(这不会保留原始 .bz2 文件):
bzip2 -d enwiki-latest-pages-articles.xml.bz2
如果要提取并保留原始内容,请运行以下命令:
bzip2 -dk enwiki-latest-pages-articles.xml.bz2
来源:https://superuser.com/questions/480950/how-to-decompress-a-bz2-file
答案2
只需使用bunzip2
:
bunzip2 enwiki-latest-pages-articles.xml.bz2
如果它是一个gzip
压缩文件:
gunzip enwiki-latest-pages-articles.xml.gz