尽管使用了 -l5，为什么 wget 仍继续递归获取？

2024-5-29 • tag-icon

我正在尝试使用镜像一个网站wget。一切都进展顺利，直到奇怪的事情发生。

我正在使用这条线：

wget -e robots=off --wait 1 -l5 --mirror --convert-links --adjust-extension --page-requisites --no-parent --no-clobber -x -nH http://www.site.info/city

首页上有一个“Om”链接（瑞典语“关于”）。这就像一个横幅，将跟随整个网站的任何页面。因此，如果我站在首页www.site.info/city并单击“Om”，我将链接到www.site.info/city/om横幅上当然有机会单击“Om”的位置。

但是，wget将继续关注每个页面上的“Om”链接（即使我只希望在第一次出现时完成）。最终它会看起来像这样：

http://www.site.info/city/om/nu/132-walk-of-fame/om/om/om/om/om/om/om/om/om/om/om/om/om/ om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/ om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/新闻邮件

Återanvänder befintlig anslutning直到www.site.info:80。

我到底该如何停止/改变这种行为wget？

相关内容