WGET 下载的网站无法正常工作

WGET 下载的网站无法正常工作

我使用 WGET 下载了一个网站。下载并转换链接后,我无法获取某些资源。

例如,使用 保存的 CSS 文件index.min.css?update=2无法加载。但如果我在新选项卡中打开链接并将链接更改为index.min.css%3fupdate=2,则文件可以加载。

很多文件都是这样保存的。如何解决这个问题?

答案1

下载网站很少能完美无缺。很多情况下,事后仍需要手动修复。

针对常见问题的一些建议:

  • wget 调用应使用参数--adjust-extension--convert-links。 选项--adjust-extension使 wget 使用扩展名保存 PHP 文件.html,而--convert-links使 wget 将下载文件中的链接转换为新创建的.html文件(但仅在所有文件都下载完成后)。

  • 当文件名包含特殊字符时,您可以使用 --restrict-file-names=nocontrol--restrict-file-names=ascii

  • 当 wget 的字符编码错误时,您可以指定 --remote-encoding,或者--remote-encoding=utf-8

(此列表绝不是详尽无遗的,可能不适用于您的问题。)

相关内容