无法使用 wget 下载 pdf 文件

无法使用 wget 下载 pdf 文件

该网站包含一个按钮,我必须单击该按钮才能打开 pdf。

我想要做的是使用“wget”和该网站的链接下载 pdf,而无需我单击按钮,然后手动复制链接

我使用了层选项 -l1,但是没有作用。

有人有主意吗?

答案1

编辑:

再次阅读你的问题,我认为我没有正确理解它。如果你想wget递归下载链接在https://www.zeewolde.nl/gemeente/formulieren-pdf_42836/,除了最大深度之外,您还需要使用-r(或) 标志来告诉它。此外,如果您想找出实际的文件名,可以使用实验选项。因此命令将是:--recursivewget--content-disposition

wget --recursive --level=1 --content-disposition "https://www.zeewolde.nl/gemeente/formulieren-pdf_42836/"

请注意,当你使用选项指定要下载的文件扩展名--accept,您必须首先另外接受php才能下载文件。但是,这将下载wget每一个 php文件。下载所有内容并手动删除不感兴趣的文件可能更简单。


原始答案:

您可能没有将 URL 括在引号中。

您提供的网站上的链接包含多个 Http GET 参数,这些参数用&字符分隔。如果您不对其进行转义,shell 将对其进行解释。最简单的方法是将整个 url 括在引号中:

wget "http://www.example.com/download.php?param1=hello&param2=world"

相关内容