笔记本评测将在月底关闭,他们的论坛里有几个帖子,我想在所有信息永远消失之前下载到我的电脑上。
我正在尝试使用HT轨道(实际上是 WinHTTrack)下载线程。例如,假设我要下载此线程:
此主题有多个页面,第 2 页及以后的 URL 如下所示:
于是我告诉 WinHTTrack 我要下载以下地址:
然后在选项>扫描规则下,我使用以下内容告诉它抓取所有图像/javascript/css和所有页面:
+*.png +*.gif +*.jpg +*.jpeg +*.css +*.js +forum.notebookreview.com/threads/what-should-we-call-an-nbr-successor.837550/page*
根据日志文件,执行的具体命令是:
winhttrack -qiC2%P%xs0u1%s%uN0%I0p3DaK0H0%kf2o0A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "en, *" http://forum.notebookreview.com/threads/what-should-we-call-an-nbr-successor.837550/ -O1 "C:\Users\username\Downloads\NotebookReview threads\Test" +*.png +*.gif +*.jpg +*.jpeg +*.css +*.js +forum.notebookreview.com/threads/what-should-we-call-an-nbr-successor.837550/page*
当我检查输出目录时,我可以看到、、index.html
和,因此它正在下载所有页面。page-2.html
page-3.html
page-4.html
但是,当我尝试在禁用网络的浏览器中加载时index.html
,图像出现问题:
如您所见,网站徽标和用户头像未显示在页面上,但我可以在 PC 上看到这些图像。当我在页面上执行“查看源代码”时,网站徽标为<img src="../../../cdn.ttgtmedia.com/techguide/forum/nbr/nbr_forum_logo.png" alt="NotebookReview" />
。当我单击时../../../cdn.ttgtmedia.com/techguide/forum/nbr/nbr_forum_logo.png
,浏览器会在我的硬盘上显示图像。因此,浏览器可以从我的硬盘加载图像,但由于某种原因,在显示 HTML 页面时无法加载。
此外,浏览器不显示菜单栏,也不显示任何背景颜色。我确实看到一些 JS 和 CSS 文件已下载到我的硬盘上。
此外,页面链接不正确。例如,第 2 页的链接指向:
但它实际上应该指向:
- 文件:///C:/Users/用户名/Downloads/NotebookReview%20threads/Test/forum.notebookreview.com/threads/what-should-we-call-an-nbr-successor.837550/page-2.html
我需要更改哪些 WinHTTrack 配置设置来解决以下问题?
图像已下载到我的电脑,但浏览器没有在下载的网页上显示它们。
菜单栏和背景颜色没有显示。
页面链接没有指向下载到我的电脑的 HTML 页面。