我一直试图保存此页面:
http://www.geopostcodes.com/Bolton?loc=Bolton
(以及来自同一域的其他类似程序)但总是会出现 NOCAPTCHA 不起作用的错误,并且页面的“显示下一个...”部分的 Javascript 不起作用。
我尝试在 Firefox 56 上使用 Scrapbook,但出现了同样的错误。SiteSucker = 同样的错误。
Firefox 的 DownThemAll! 执行了多个 URL,但所有页面仍然出现相同的 NOCAPTCHA 错误。
我还没有尝试过 HTTrack,因为我使用的是 OSX 并且还没有安装 MacPorts。
通过将页面另存为...以常规方式保存它我还没有尝试过,但那是因为我试图找到一种方法来保存来自网站的几个 URL。
基本上,我想尝试保存所有页面
http://www.geopostcodes.com/UK(及子页面)
为后人
我使用的是 Mac Mini 2011,使用 Mac OS Sierra。
如果有人能帮助我找到一个可行的解决方案来保存页面以供后人离线使用,我将不胜感激。
答案1
这些页面是在您查看时使用 Javascript 和 ajax 调用服务器生成的。复制 HTML 或从浏览器保存是行不通的。
最好的办法可能是将您想要的数据从页面复制/粘贴到文本文件或电子表格中。或者编写浏览器插件来为您提取数据。