列出嵌套 zip 文件中的文件而不解压

列出嵌套 zip 文件中的文件而不解压

我有一组嵌套的 zip 文件,我需要列出文件名无需提取档案馆。例如:

  • Zip1.zip
    • 文本1
    • 文本2
    • Zip2.zip
      • 样品1
      • 样品2

使用一些 shell 脚本应该会产生一个列表,例如

Zip1.zip
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2

答案1

unzip -p 标志会将未压缩的数据通过管道传输到标准输出。不幸的是,unzip由于某种原因,程序没有从标准输入读取的选项。改编 python oneliner回答类似的问题就可以了。

例如:

unzip -p Zip1.zip Zip1/zip2.zip| python -c 'import zipfile,sys,StringIO;print "\n".join(zipfile.ZipFile(StringIO.StringIO(sys.stdin.read())).namelist())'

补充:Java jar 工具可以从 stdin 读取。被盗自回答。

例如:

unzip -p Zip1.zip  Zip1/zip2.zip| jar -t

输出:

zip2/
zip2/Sample2
zip2/Sample1

原始压缩文件:

$ unzip -l Zip1.zip 
Archive:  Zip1.zip
  Length      Date    Time    Name
---------  ---------- -----   ----
        0  2015-11-03 15:49   Zip1/
        5  2015-11-03 15:49   Zip1/text1
        5  2015-11-03 15:49   Zip1/text2
      474  2015-11-03 15:48   Zip1/zip2.zip
---------                     -------
      484                     4 files

找到了相关的Serverfault线程你的-评论


这不是 shell 脚本,但它执行了原始问题中建议的操作:

#!/usr/bin/python
# Usage: python list-zips.py <zipfile>

import zipfile
import io
import sys

def uz(f, parent=[]):

    result = []
    try:
        zf = zipfile.ZipFile(f)
        for e in zf.namelist():
            path=parent+[e]
            if e.lower().endswith(".zip"):
                result += uz(io.BytesIO(zf.open(e).read()), path)
            else:
                result.append("/".join(path))

    except Exception as ex:
        return result

    return result

print("\n".join(uz(open(sys.argv[1], "rb"), [sys.argv[1]])))

$ python list-zips.py Zip1.zip 
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2

相关内容