我正在使用以下命令从网页下载所有文件:
wget --recursive "http://example.com"
这有时会导致以下错误:
no-follow attribute found in www.example.com. Will not follow any links on this page
根据gnu网站,我必须添加-e robots=off --wait 0.25
到我的命令中。
我的最终命令如下所示(我不想要span-hosts
):
wget --recursive -e robots=off --wait 0.5 "http://example.com"
但是我仍然收到上述错误。我该怎么做才能忽略这些属性?
答案1
正确的方法就在那里。你只需要尝试一下
wget -r -erobots=off "your_url"
答案2
答案3
就我而言,我在 中遇到了语法错误--follow-tags
。删除语法错误可使 wget 继续运行,尽管存在 no-follow 属性。