无法打开使用 wget 检索的 .gzip 档案

无法打开使用 wget 检索的 .gzip 档案

我正在尝试使用 cygwin 终端中的 wget 下载服务器上托管的目录的内容。我可以毫无问题地获取文件,但它们都是 .gz 存档,一旦下载就无法打开……这是我正在使用的行:

wget -rnH --cut-dir=5 --header="Accept-Encoding:gzip" "http://someHost/bla/bli/bla/bla/2014/0254_REV2"

有人知道如何使用 wget 检索可用的档案吗?

任何帮助都将不胜感激,提前感谢您的考虑;)

答案1

我发现这个

如果您请求经过 gzip 压缩的内容(使用 accept-encoding: gzip 标头,这是正确的),那么据我所知,wget 无法读取内容。因此,您最终会在磁盘上得到一个经过 gzip 压缩的文件,其中包含您访问的第一个页面,但没有其他内容。

即您不能使用 wget 来请求 gzip 压缩的内容并同时递归整个站点。

我认为有一个补丁可以让 wget 支持此功能,但它不在默认分发版本中。

如果包含 -S 标志,则可以判断 Web 服务器是否响应了正确的内容类型。例如,

wget -S --header="accept-encoding: gzip" wordpress.com

相关内容