是不是 HTTrack 只能下载有索引页的网站?索引页应该包含指向网站上所有其他页面的所有链接,对吗?或者,至少,网站上的所有页面必须以某种方式通过链接相互连接,对吗?因此,如果至少有一个页面不包含任何链接,并且没有链接到任何其他页面,那么 HTTrack 就不会下载这种页面,对吗?
我正在尝试在免费主机上下载一个网站(实际上它不是一个网站,而是一组图片和一些 HTML 文档,它们不一定相互关联)。该网站将在大约两周后关闭,所以我需要抓紧时间才能从该网站下载我的所有图片。因此,我尝试使用 HTTrack 尝试下载整个网站,但在此过程中我收到一条消息,内容如下:
WinHTTrack 网站复制器
- 镜像错误!* * HTTrack 检测到当前镜像为空。如果是更新,则之前的镜像已恢复。原因:无法找到首页,或者出现连接问题。=> 确保网站仍然存在,和/或检查您的代理设置!<=
我正在使用 Windows XP。
答案1
您说得对,此类工具只能基于页面之间的链接才能发挥作用。如果某个页面没有其他页面指向它,则它对 HTTrack(和其他“蜘蛛”工具)来说是“不可见的”。如果您知道这些“未链接”页面的 URL,则可以手动添加它们。
但是,如果 Web 服务器启用了“目录浏览”,则通过指向包含目录但没有页面名称的 URL,它将显示目录中所有文件的列表。但出于安全原因,它很少被激活。大多数情况下,如果没有指定页面名称,Web 服务器将提供默认页面(index.html、index.php、default.html 等),而不是目录内容。