下载网页中的所有 PDF 链接?

下载网页中的所有 PDF 链接?

你知道有哪个好的软件可以下载网页上的所有 PDF 链接吗?

操作系统是Windows 7。

答案1

您可以使用获得并运行如下命令:

wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com

或者使用简短选项:

wget -r -l 1 -nd -nH -A pdf http://example.com

更新:由于更新显示你正在运行 Windows 7:使用Windows 版 wgetcmd提示。

更新 2:对于图形解决方案 - 虽然它可能有点过头,因为它也会获取其他文件全部击倒

答案2

  1. 在浏览器中,按CTRL+ SHIFT+ J,然后输入

    var pdflinks =[]; Array.prototype.map.call(document.querySelectorAll("a[href$=\".pdf\"]"), function(e, i){if((pdflinks||[]).indexOf(e.href)==-1){ pdflinks.push( e.href);} }); console.log(pdflinks.join(" "));

    这将在控制台中返回:

    https://superuser.com/questions/tagged/somepdf1.pdf“ “https://superuser.com/questions/tagged/somepdf2.pdf“ “https://superuser.com/questions/tagged/somepdf3.pdf

  2. 现在使用wget使用命令行选项wget url1 url2 ...

复制并粘贴此内容,打开控制台,wget按鼠标右键插入剪贴板内容,然后按回车键。

要使用下载文件,请用“\n”连接各行并使用以下参数wget -i mydownload.txt

请注意,大多数其他(GUI)下载程序也接受使用空格分隔的 URL 列表来调用。

希望这能有所帮助。我通常都是这样做的。它比任何带有图形用户界面的扩展都更快、更灵活,我必须学习并熟悉它。

答案3

如果您想继续使用浏览器,我已经为此目的编写了一个网络扩展 - 我正在努力添加保存具有正确格式标题的学术文章 PDF 的功能,但如果您只是想下载所有内容,它是完美的选择。

它被称为标签保存以及 Chrome 网上应用店这里。如果您只是在选项卡中打开所有 URL,则甚至不必输入 URL 列表(但对于大量文件,这可能会降低计算机速度,因此我添加了添加您自己的 URL 的选项)。

答案4

在 Google Chrome 上,可以使用以下扩展程序:

  • 下载大师

    通过此扩展,您可以下载您正在访问的网页上链接的所有图像、视频、pdf、doc 和任何其他文件。

相关内容