使用 wget 下载整个网站以供离线使用(包括外部图像服务器)

使用 wget 下载整个网站以供离线使用(包括外部图像服务器)

好的,我在 Windows 7 上安装了 wget 1.12,并且可以对它进行基本的下载。

我正在尝试下载的网站:http://www.minsterfm.co.uk

并且其上的所有图像都存储在外部http://cml.sad.ukrd.com/图像/

如何下载网站和外部图像并可能允许所有文件保留其原始扩展名,而无需将 .php 文件转换为 .htm

我将非常感激任何帮助,因为我对 wget 还不熟悉。

答案1

手动的告诉我们:

实际上,为了下载单个页面及其所有必需内容(即使它们存在于不同的网站上),并确保所有内容在本地正确显示,除了“-p”之外,作者还喜欢使用一些选项:

wget -E -H -k -K -p http://the.site.com

你必须将它与一些递归下载选项。您宁愿使用--wait=xx--limit-rate=xxK并且-U agent-string不被服务器列入黑名单……

答案2

我用过黑寡妇用于在 Windows 上递归下载网站。

它具有以下功能,但不是免费的:

  • 脚本引擎
  • 方便使用的
  • NetSpy(网络间谍)
  • SnapShot(网页快照)
  • 类似 Windows 资源管理器的站点视图
  • 强大的扫描过滤器
  • 可扩展解析器
  • 通配符和正则表达式

相关内容