镜像完整网站1及所有指向特定网站2的链接

镜像完整网站1及所有指向特定网站2的链接

我想镜像一个即将关闭的网站,我目前面临的问题很简单 - >将整个网站1和所有链接(将是文件/图像/类似内容)镜像到网站2,所以我得到了一个很好的“合并”镜像。

-因此问题是:

如何使用 wget 来实现这一点?还有其他方法可以解决这个问题吗(如果无法使用 wget)?

-逻辑示例:

该网站是http://example.org并且它将被镜像(wget -mk)。wget 还应该镜像托管在http://foo.bar也没有别的了。

答案1

您正在寻找类似这样的内容:

wget -mk -w 20 http://www.example.com/ --exclude-domains sunsite.foo.edu --domains yahoo.com,google.com
  • 打开适合镜像的选项;时间戳和无限递归深度保存目录列表。
  • 下载完成后,转换文档中的链接,使其适合本地查看。
  • w 秒在访问服务器之间引入延迟。
  • --exclude-domains 域列表不应遵循的领域。
  • --domains 域名列表一组要遵循的域,以逗号分隔的域列表。

答案2

rysnc 将镜像文件

rysnc -auvz source destination

-u 标志将跳过目标上较新的文件,所以这可能就是您想要的。

答案3

wget -p -k http://example.org

-p 将为您提供正确查看网站所需的所有元素(css、图像等)。-k 将更改所有链接(包括 CSS 和图像的链接),以便您离线查看页面时,就像在线显示一样。

相关内容