该网站包含一个按钮,我必须单击该按钮才能打开 pdf。
我想要做的是使用“wget”和该网站的链接下载 pdf,而无需我单击按钮,然后手动复制链接
我使用了层选项 -l1,但是没有作用。
有人有主意吗?
答案1
编辑:
再次阅读你的问题,我认为我没有正确理解它。如果你想wget
递归下载链接在https://www.zeewolde.nl/gemeente/formulieren-pdf_42836/,除了最大深度之外,您还需要使用-r
(或) 标志来告诉它。此外,如果您想找出实际的文件名,可以使用实验选项。因此命令将是:--recursive
wget
--content-disposition
wget --recursive --level=1 --content-disposition "https://www.zeewolde.nl/gemeente/formulieren-pdf_42836/"
请注意,当你能使用选项指定要下载的文件扩展名--accept
,您必须首先另外接受php
才能下载文件。但是,这将下载wget
每一个 php
文件。下载所有内容并手动删除不感兴趣的文件可能更简单。
原始答案:
您可能没有将 URL 括在引号中。
您提供的网站上的链接包含多个 Http GET 参数,这些参数用&
字符分隔。如果您不对其进行转义,shell 将对其进行解释。最简单的方法是将整个 url 括在引号中:
wget "http://www.example.com/download.php?param1=hello¶m2=world"