我正在尝试下载此页面下的所有 pdf 文件,其中包含 759 个 href 链接,这些链接可通往下一级的几个 pdf 链接。根据这个论坛的一些讨论,我尝试了以下方法
wget -r -l 3 --accept=pdf --adjust-extension http://www.judicial.gov.tw/constitutionalcourt/p03.asp
但它返回“正在删除 [url],因为它应该被拒绝。
如果我能在这里得到一些帮助,我将非常感激。我添加 --adjust-extension 的原因是因为我怀疑 url.asp 搞乱了 wget。
答案1
尝试这个:
wget -m -r -l 3 --accept=pdf,html,asp --adjust-extension http://www.judicial.gov.tw/constitutionalcourt/p03.asp