我使用 WGET 下载了一个网站。下载并转换链接后,我无法获取某些资源。
例如,使用 保存的 CSS 文件index.min.css?update=2
无法加载。但如果我在新选项卡中打开链接并将链接更改为index.min.css%3fupdate=2
,则文件可以加载。
很多文件都是这样保存的。如何解决这个问题?
答案1
下载网站很少能完美无缺。很多情况下,事后仍需要手动修复。
针对常见问题的一些建议:
wget 调用应使用参数
--adjust-extension
和--convert-links
。 选项--adjust-extension
使 wget 使用扩展名保存 PHP 文件.html
,而--convert-links
使 wget 将下载文件中的链接转换为新创建的.html
文件(但仅在所有文件都下载完成后)。当文件名包含特殊字符时,您可以使用
--restrict-file-names=nocontrol
或--restrict-file-names=ascii
。当 wget 的字符编码错误时,您可以指定
--remote-encoding
,或者--remote-encoding=utf-8
。
(此列表绝不是详尽无遗的,可能不适用于您的问题。)