wget --spider：如何判断损坏的链接来自何处

Question 1

您应该能够结合 wget 运行来查看 Web 服务器日志。404在日志文件中查找并提取该referrer字段。这将告诉您包含损坏链接的页面。

然后只需检查该页面是否有违规链接即可。

Answer

您应该能够结合 wget 运行来查看 Web 服务器日志。404在日志文件中查找并提取该referrer字段。这将告诉您包含损坏链接的页面。

然后只需检查该页面是否有违规链接即可。

Question 2

一个好方法（不涉及网络服务器日志）是使用 flag--debug和 grep^Referer:

在命令行上：

wget -r -nv --spider http://www.domain.com/ 2>&1 | egrep -A 1 '(^---response end---$|^--[0-9]{4}-[0-9]{2}-[0-9]{2}|^[0-9]{4}-[0-9]{2}-[0-9]{2} ERROR|^Referer:|^Remote file does not)'

您可以在日志上执行类似的 grep 操作。警告：某些 wget 编译时不支持--debug

Answer

一个好方法（不涉及网络服务器日志）是使用 flag--debug和 grep^Referer:

在命令行上：

wget -r -nv --spider http://www.domain.com/ 2>&1 | egrep -A 1 '(^---response end---$|^--[0-9]{4}-[0-9]{2}-[0-9]{2}|^[0-9]{4}-[0-9]{2}-[0-9]{2} ERROR|^Referer:|^Remote file does not)'

您可以在日志上执行类似的 grep 操作。警告：某些 wget 编译时不支持--debug

wget --spider：如何判断损坏的链接来自何处

答案1

答案2

相关内容