Wget爬行无需下载文件

Question

我不相信有办法做到这一点。为了解析这些文件的内容以查看是否有其他链接可遵循，wget必须下载它们。

您最好的选择可能是这样做：

$ wget --random-wait --mirror --no-parent -A x--*.html myBaseURL -O /dev/null &

计算匹配数：

wget --random-wait --mirror --no-parent -A x--*.html myBaseURL -O | wc -l

Answer 1

我不相信有办法做到这一点。为了解析这些文件的内容以查看是否有其他链接可遵循，wget必须下载它们。

您最好的选择可能是这样做：

$ wget --random-wait --mirror --no-parent -A x--*.html myBaseURL -O /dev/null &

计算匹配数：

wget --random-wait --mirror --no-parent -A x--*.html myBaseURL -O | wc -l

相关内容