如何获取网页的完美本地副本?

如何获取网页的完美本地副本?

无论我尝试过哪种浏览器(甚至是 Chrome),将网页保存为本地文件时,效果都不太准确。大量的 JavaScript 等似乎会出错。我正在寻找某种方法来获得 100% 完美的网页本地副本。换句话说,所有 CSS/图像/JavaScript 也应该下拉,并且对所述内容的 HTML 引用应该更改为指向本地文件夹。有办法吗?我主要使用 Mac,但我可以使用 Linux。

答案1

“大量 JavaScript 等似乎会出错”的原因可能是许多公司使用内容管理系统(Joomla、Drupal 和 Wordpress),这些系统使用这些系统来查询数据库以获取内容。如果是这样,您将无法获得所需的整个页面。所以这取决于网页。

答案2

尝试使用下载网站HT轨道。这些选项允许您配置本地下载文件的链接方式以及下载的具体内容。Windows、Linux 和 Mac 版本均可用。

答案3

您需要使用 Httrack 下载整个网站(您需要设置它,以便它不会下载外部 JavaScript)...只需运行它,然后查看下载的目录,再次运行 Httrack 并排除(fe-.googlesyndication.com/* -.facebook.net/-*.google-analytics.com/** 等)

您也可以使用 Wget:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://www.yourdomain.com

完成后,您仍然需要重写所有链接,使它们不指向 .../index.html。这解决了动态到静态 HTML 转换器

答案4

如果您使用的是 Linux,那么您可能想尝试一下这个命令。

wget

我提供了从互联网下载的更多灵活性。

例如:- 终端类型

wget -m "www.example.com"

-m代表(网站的)镜像。您还可以指定下载网站的深度。

相关内容