Wget 生成文件而不是 HTML

Wget 生成文件而不是 HTML

我正在尝试下载整个网站以供离线查看

wget --mirror -p --convert-links https://www.example.com

但完成后,一些 HTML 文档没有扩展名。Windows 只是指出它们的文件类型是File。我可以通过添加.html文件名(我ren *.* *.html在命令提示符中使用)将它们更改为 HTML 文档,但链接无法正常工作。如何让 wget 将 HTML 文档下载为 HTML 或自动重构链接以使用新文件?有超过 10,000 个单独的 HTML 文件,所以我不想手动执行此操作。

我正在运行 Windows 10,并通过 Windows Subsystem for Linux 使用 Ubuntu 18.04 终端。

答案1

所以我明白了。我必须添加选项-E,或--html-extension,才能强制将文件设置为.html文件,从而使整个字符串成为:

wget --mirror -p --convert-links -E https://www.example.com

相关内容