我正在尝试使用 镜像一个网站wget
。一切都进展顺利,直到奇怪的事情发生。
我正在使用这条线:
wget -e robots=off --wait 1 -l5 --mirror --convert-links --adjust-extension --page-requisites --no-parent --no-clobber -x -nH http://www.site.info/city
首页上有一个“Om”链接(瑞典语“关于”)。这就像一个横幅,将跟随整个网站的任何页面。因此,如果我站在首页www.site.info/city
并单击“Om”,我将链接到www.site.info/city/om
横幅上当然有机会单击“Om”的位置。
但是,wget
将继续关注每个页面上的“Om”链接(即使我只希望在第一次出现时完成)。最终它会看起来像这样:
Återanvänder befintlig anslutning直到www.site.info:80。
我到底该如何停止/改变这种行为wget
?