我有一组嵌套的 zip 文件,我需要列出文件名无需提取档案馆。例如:
- Zip1.zip
- 文本1
- 文本2
- Zip2.zip
- 样品1
- 样品2
使用一些 shell 脚本应该会产生一个列表,例如
Zip1.zip
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2
答案1
unzip -p 标志会将未压缩的数据通过管道传输到标准输出。不幸的是,unzip
由于某种原因,程序没有从标准输入读取的选项。改编 python oneliner这回答类似的问题就可以了。
例如:
unzip -p Zip1.zip Zip1/zip2.zip| python -c 'import zipfile,sys,StringIO;print "\n".join(zipfile.ZipFile(StringIO.StringIO(sys.stdin.read())).namelist())'
补充:Java jar 工具可以从 stdin 读取。被盗自这回答。
例如:
unzip -p Zip1.zip Zip1/zip2.zip| jar -t
输出:
zip2/
zip2/Sample2
zip2/Sample1
原始压缩文件:
$ unzip -l Zip1.zip
Archive: Zip1.zip
Length Date Time Name
--------- ---------- ----- ----
0 2015-11-03 15:49 Zip1/
5 2015-11-03 15:49 Zip1/text1
5 2015-11-03 15:49 Zip1/text2
474 2015-11-03 15:48 Zip1/zip2.zip
--------- -------
484 4 files
这不是 shell 脚本,但它执行了原始问题中建议的操作:
#!/usr/bin/python
# Usage: python list-zips.py <zipfile>
import zipfile
import io
import sys
def uz(f, parent=[]):
result = []
try:
zf = zipfile.ZipFile(f)
for e in zf.namelist():
path=parent+[e]
if e.lower().endswith(".zip"):
result += uz(io.BytesIO(zf.open(e).read()), path)
else:
result.append("/".join(path))
except Exception as ex:
return result
return result
print("\n".join(uz(open(sys.argv[1], "rb"), [sys.argv[1]])))
$ python list-zips.py Zip1.zip
Zip1.zip/text1
Zip1.zip/text2
Zip1.zip/Zip2.zip/Sample1
Zip1.zip/Zip2.zip/Sample2