在登录表单后面镜像网站

在登录表单后面镜像网站

简洁版本:

  • 我想截取包含完整 HTML+CSS+JS+图像的 URL 的离线副本并将它们保存在本地,保留原始站点的结构和文件内容。
  • 我在使用我能找到的工具(例如“保存完成”Firefox 扩展、HTTrack、wget、Teleport Pro)时遇到了麻烦,部分原因是 URL 位于登录表单后面。

较长的版本:

在开发我的应用程序时,我经常想拍摄一个离线的完整 HTML+CSS+JS+图像版本,发送给与我合作的设计师,他进行修改后再发回。然后我将更改应用到应用程序中。

事实证明,这比让他/她使用实时应用程序浏览我们的代码要高效得多,但有一个问题——我找不到方便的镜像应用程序。

Firefox 扩展(例如“保存完成”)已经具有登录 cookie,因此不关心它们是否位于登录表单后面,但它们会破坏本地保存的文件,使得无法使用它们。

wget 或 Teleport Pro 等镜像工具不支持我们的登录表单。

不过,HTTrack 应该能够在代理模式下运行以检测登录信息,但我始终无法让它工作。作为备用方案,它可以接受我硬连线到其 cookies.txt 文件中的 cookie,但我总是需要几个小时才能可靠地做到这一点。

有什么工具、浏览器扩展等可以做到这一点吗?开源、商业——任何东西都可以。如果我一直在误用 HTTrack,而且这实际上很容易做到——这也是一个很好的答案。

答案1

我已经成功地做到了这一点温特克。您可以按照正常程序捕获网站,但需要进行两项小的设置调整:

  1. 在 Chrome 中,打开 Dev Tools,然后登录您需要捕获的网站。在“网络”选项卡中,单击您请求的 HTML 页面以查找您的会话 cookie(其名称将根据所使用的后端框架而有所不同)。将其放入“其他 HTTP 标头”下的 HTTrack 中。

  2. 还要确保您的用户代理字符串匹配,因为如果用户代理字符串发生变化,有时会话会被​​阻止。

    会话 cookie 登录 HTTrack

  3. 开始下载网站。结果应该和您登录时一样。

答案2

使用 HTTrack 你可以拥有它使用 cookies.txt 文件下载时。我曾用它成功镜像了一个 moodle 网站。

答案3

你有没有尝试过离线资源管理器

我记得有类似的东西可以让你登录,从而保存后续请求的 cookie,然后完成剩下的工作。我不确定 100% 是否正确,因为我很久以前就用过它了。

答案4

Teleport Pro 允许使用登录名和密码。

当您启动新项目向导时,您会看到它为您提供该选项(我认为它位于选项的第 3 个屏幕中)。

即使您错过了,您也可以再次访问该选项。

在主窗口中(完成项目向导后),右键单击您的项目(左侧窗格上显示您要下载的 URL 的小文件夹图标),并选择最后一个选项Starting Address Properties,您将看到一个选项屏幕,您可以在其中指定在该站点中使用的用户登录名和密码。

相关内容