尝试从即将关闭的论坛下载帖子,但 HTTrack 无法正确保存图像/菜单/颜色和页面链接

尝试从即将关闭的论坛下载帖子,但 HTTrack 无法正确保存图像/菜单/颜色和页面链接

笔记本评测将在月底关闭,他们的论坛里有几个帖子,我想在所有信息永远消失之前下载到我的电脑上。

我正在尝试使用HT轨道(实际上是 WinHTTrack)下载线程。例如,假设我要下载此线程:

此主题有多个页面,第 2 页及以后的 URL 如下所示:

于是我告诉 WinHTTrack 我要下载以下地址:

然后在选项>扫描规则下,我使用以下内容告诉它抓取所有图像/javascript/css和所有页面:

+*.png +*.gif +*.jpg +*.jpeg +*.css +*.js +forum.notebookreview.com/threads/what-should-we-call-an-nbr-successor.837550/page*

根据日志文件,执行的具体命令是:

winhttrack -qiC2%P%xs0u1%s%uN0%I0p3DaK0H0%kf2o0A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "en, *" http://forum.notebookreview.com/threads/what-should-we-call-an-nbr-successor.837550/ -O1 "C:\Users\username\Downloads\NotebookReview threads\Test" +*.png +*.gif +*.jpg +*.jpeg +*.css +*.js +forum.notebookreview.com/threads/what-should-we-call-an-nbr-successor.837550/page*

当我检查输出目录时,我可以看到、、index.html和,因此它正在下载所有页面。page-2.htmlpage-3.htmlpage-4.html

但是,当我尝试在禁用网络的浏览器中加载时index.html,图像出现问题:

在此处输入图片描述

如您所见,网站徽标和用户头像未显示在页面上,但我可以在 PC 上看到这些图像。当我在页面上执行“查看源代码”时,网站徽标为<img src="../../../cdn.ttgtmedia.com/techguide/forum/nbr/nbr_forum_logo.png" alt="NotebookReview" />。当我单击时../../../cdn.ttgtmedia.com/techguide/forum/nbr/nbr_forum_logo.png,浏览器会在我的硬盘上显示图像。因此,浏览器可以从我的硬盘加载图像,但由于某种原因,在显示 HTML 页面时无法加载。

此外,浏览器不显示菜单栏,也不显示任何背景颜色。我确实看到一些 JS 和 CSS 文件已下载到我的硬盘上。

此外,页面链接不正确。例如,第 2 页的链接指向:

但它实际上应该指向:

  • 文件:///C:/Users/用户名/Downloads/NotebookReview%20threads/Test/forum.notebookreview.com/threads/what-should-we-call-an-nbr-successor.837550/page-2.html

我需要更改哪些 WinHTTrack 配置设置来解决以下问题?

  1. 图像已下载到我的电脑,但浏览器没有在下载的网页上显示它们。

  2. 菜单栏和背景颜色没有显示。

  3. 页面链接没有指向下载到我的电脑的 HTML 页面。

相关内容