我正在尝试下载整个网站以供离线查看
wget --mirror -p --convert-links https://www.example.com
但完成后,一些 HTML 文档没有扩展名。Windows 只是指出它们的文件类型是File
。我可以通过添加.html
文件名(我ren *.* *.html
在命令提示符中使用)将它们更改为 HTML 文档,但链接无法正常工作。如何让 wget 将 HTML 文档下载为 HTML 或自动重构链接以使用新文件?有超过 10,000 个单独的 HTML 文件,所以我不想手动执行此操作。
我正在运行 Windows 10,并通过 Windows Subsystem for Linux 使用 Ubuntu 18.04 终端。
答案1
所以我明白了。我必须添加选项-E
,或--html-extension
,才能强制将文件设置为.html
文件,从而使整个字符串成为:
wget --mirror -p --convert-links -E https://www.example.com