Wget 返回二进制而不是 html？

Question 1

这是一个压缩包压缩文件。您可以通过运行以下命令找到这一点file命令，它计算出文件格式神奇的数字在数据中（这也是 Text Wrangler 等程序确定文件被压缩的方式）：

file output.html
wget -O - … | file -

服务器（我从您显示的内容中猜测）正在发送压缩数据并正确设置标头

Content-Encoding: gzip

但 wget 不支持这一点。在最近的版本中，wget 发送Accept-encoding: identity, 来告诉服务器不要压缩或以其他方式编码数据。在旧版本中，您可以手动发送标头：

wget --header 'Accept-encoding: identity' …

然而，这个特定的服务器似乎已损坏：即使被告知不要以任何方式对数据进行编码，它也会发送压缩数据。因此，您必须手动解压缩数据。

wget -O output.html.gz … && gunzip output.html.gz

Answer

这是一个压缩包压缩文件。您可以通过运行以下命令找到这一点file命令，它计算出文件格式神奇的数字在数据中（这也是 Text Wrangler 等程序确定文件被压缩的方式）：

file output.html
wget -O - … | file -

服务器（我从您显示的内容中猜测）正在发送压缩数据并正确设置标头

Content-Encoding: gzip

但 wget 不支持这一点。在最近的版本中，wget 发送Accept-encoding: identity, 来告诉服务器不要压缩或以其他方式编码数据。在旧版本中，您可以手动发送标头：

wget --header 'Accept-encoding: identity' …

然而，这个特定的服务器似乎已损坏：即使被告知不要以任何方式对数据进行编码，它也会发送压缩数据。因此，您必须手动解压缩数据。

wget -O output.html.gz … && gunzip output.html.gz

Question 2

该文件仍以gzip.

可以看到前两个字节0x1f8b匹配gzip签名。因此，要读取数据，您需要将其解压缩。

mv file.dat file.dat.gz
gunzip file.dat.gz

或者

zcat file.dat

Answer

该文件仍以gzip.

可以看到前两个字节0x1f8b匹配gzip签名。因此，要读取数据，您需要将其解压缩。

mv file.dat file.dat.gz
gunzip file.dat.gz

或者

zcat file.dat

相关内容