我正在使用 wget 在本地主机上创建 php 模板站点的 HTML 镜像。我遇到一些目录被镜像为无扩展文档的问题。
什么可能导致这个问题?
我正在使用这个命令:
$ wget -mk http://www.example.com/
答案1
什么可能导致这个问题?
您是否检查过实际站点始终返回带有扩展名的文档?没有任何协议需要这样做,不使用它们是完全正常的;文档类型由 http 标头决定,而不是地址上的任何后缀。当然,您的文件浏览器做使用文件扩展名来识别文档,因此这可能会很麻烦。
例如,这个页面字面上是 http://unix.stackexchange.com/questions/124741/wget-corrupted-directories
,如果您使用 来获取它wget
,它将生成一个wget-corrupted-directories
没有扩展名的文件,其中包含 html 数据。
答案2
你缺少--html-extension
旗帜。
我建议改用这种语法:
wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains website.org \
--no-parent \
www.website.org