我有以下页面
http://www.fda.gov/downloads/scienceresearch/fieldscience/laboratorymanual/ucm092156.pdf
我想找到 www.fda.gov 上链接到此页面的页面?我该怎么做?
答案1
您可以使用
wget
递归下载整个网站:wget --recursive --page-requisites --html-extension --no-parent --domains www.fda.gov www.fda.gov
然后,您可以使用
egrep
递归搜索所有文件来查找哪些页面链接到 ucm092156.pdf:egrep -r -o '*ucm092156.pdf' www.fda.gov/