提供带有原始标题的镜像(静态)网页

提供带有原始标题的镜像(静态)网页

我有一个动态网页,我想创建它的“冻结”副本。

通常我会做类似的事情wget -m http://example.com,然后将文件放在 Web 服务器的文档根目录中。

然而,该网站有一些动态内容,包括动态生成的图像,例如

http://example.com/company/123/logo

这意味着为了镜像页面,我需要

  1. 保存服务器当前为每个 URL 提供的任何标头(至少是它报告的 MIME 类型)。

    wget这可以使用选项来完成--save-headers

  2. 提供静态页面为每个文件提供适当的标题(至少是内容类型标题)。

    (我不知道该怎么做。)

解决这个问题的最佳方法是什么?欢迎提出任何建议。

换句话说:我如何才能提供没有扩展名的文件,并且具有正确的 MIME 类型标头?(原始网络服务器定义了什么正确的MIME 类型确实是。)

答案1

如果你可以忍受问题的最后一部分(“原始服务器在哪里定义正确的 MIME 类型”),并且你正在使用 Apache,那么你可以使用mod_mime_magic自动检测并为您的文件提供正确的 MIME 类型。

相关内容