为什么 Cyotek WebCopy 和 HTTrack 等网站复制工具无法找到 Google 等搜索引擎可以找到的文件?
我想将目标网站保密,但以下是一些详细信息: 这是一个个人(单一作者)公开文档/作品集/博客类型的网站 它似乎使用 Apache 托管 据我所知,内容是静态的 当在某些相对路径上使用浏览器时,它会使用浏览器的文件“索引”视图为它们提供服务 它似乎没有 robot.txt 它有一个根 index.html 这不是一些“秘密”信息(它在公共网络上,并且那里没有登录/帐户) 那里有“公共”图像和 html 文件,它们最终没有从 index.html 链接。主题工具 Cyotek WebCopy 和 HTTrack 无法找到这些文件,但 Google 可以:sit...