我想镜像一个即将关闭的网站,我目前面临的问题很简单 - >将整个网站1和所有链接(将是文件/图像/类似内容)镜像到网站2,所以我得到了一个很好的“合并”镜像。
-因此问题是:
如何使用 wget 来实现这一点?还有其他方法可以解决这个问题吗(如果无法使用 wget)?
-逻辑示例:
该网站是http://example.org并且它将被镜像(wget -mk)。wget 还应该镜像托管在http://foo.bar也没有别的了。
答案1
您正在寻找类似这样的内容:
wget -mk -w 20 http://www.example.com/ --exclude-domains sunsite.foo.edu --domains yahoo.com,google.com
- 米打开适合镜像的选项;时间戳和无限递归深度保存目录列表。
- 钾下载完成后,转换文档中的链接,使其适合本地查看。
- w 秒在访问服务器之间引入延迟。
- --exclude-domains 域列表不应遵循的领域。
- --domains 域名列表一组要遵循的域,以逗号分隔的域列表。
答案2
rysnc 将镜像文件
rysnc -auvz source destination
-u 标志将跳过目标上较新的文件,所以这可能就是您想要的。
答案3
wget -p -k http://example.org
-p 将为您提供正确查看网站所需的所有元素(css、图像等)。-k 将更改所有链接(包括 CSS 和图像的链接),以便您离线查看页面时,就像在线显示一样。