爬取网站文件

Question

我最初打算提出wget这个解决方案，但经过进一步研究，我注意到了一些事情：

通过访问网站上的电子书页面之一，您可以看到 PDF 下载链接的 URL。您可以使用它下载 PDF，如下所示：

wget http://file.allitebooks.com/20170102/Smart%20Home%20Automation%20with%20Linux%20and%20Raspberry%20Pi,%202%20edition.pdf

但这不是递归的，也没有办法知道什么位于该目录中，而无需检查每个博客文章并复制下载链接。

Answer 1

我最初打算提出wget这个解决方案，但经过进一步研究，我注意到了一些事情：

通过访问网站上的电子书页面之一，您可以看到 PDF 下载链接的 URL。您可以使用它下载 PDF，如下所示：

wget http://file.allitebooks.com/20170102/Smart%20Home%20Automation%20with%20Linux%20and%20Raspberry%20Pi,%202%20edition.pdf

但这不是递归的，也没有办法知道什么位于该目录中，而无需检查每个博客文章并复制下载链接。

相关内容