wget - 损坏的目录

wget - 损坏的目录

我正在使用 wget 在本地主机上创建 php 模板站点的 HTML 镜像。我遇到一些目录被镜像为无扩展文档的问题。

什么可能导致这个问题?

我正在使用这个命令:

$ wget -mk http://www.example.com/

损坏目录的屏幕截图。

答案1

什么可能导致这个问题?

您是否检查过实际站点始终返回带有扩展名的文档?没有任何协议需要这样做,不使用它们是完全正常的;文档类型由 http 标头决定,而不是地址上的任何后缀。当然,您的文件浏览器使用文件扩展名来识别文档,因此这可能会很麻烦。

例如,这个页面字面上是 http://unix.stackexchange.com/questions/124741/wget-corrupted-directories,如果您使用 来获取它wget,它将生成一个wget-corrupted-directories没有扩展名的文件,其中包含 html 数据。

答案2

你缺少--html-extension旗帜。

我建议改用这种语法:

wget \
 --recursive \
 --no-clobber \
 --page-requisites \
 --html-extension \
 --convert-links \
 --restrict-file-names=windows \
 --domains website.org \
 --no-parent \
     www.website.org

相关内容