如何找到链接到特定页面的页面?

如何找到链接到特定页面的页面?

我有以下页面

http://www.fda.gov/downloads/scienceresearch/fieldscience/laboratorymanual/ucm092156.pdf

我想找到 www.fda.gov 上链接到此页面的页面?我该怎么做?

答案1

  1. 您可以使用wget递归下载整个网站:

    wget --recursive --page-requisites --html-extension --no-parent --domains www.fda.gov www.fda.gov

  2. 然后,您可以使用egrep递归搜索所有文件来查找哪些页面链接到 ucm092156.pdf:

    egrep -r -o '*ucm092156.pdf' www.fda.gov/

相关内容