搜索当前页面链接的页面的文本内容

搜索当前页面链接的页面的文本内容

这正是我正在寻找的工具:https://www.makeuseof.com/tag/search-search-content-linked-current-web-page/但它似乎不再存在,而且我找不到任何类似的东西。

简而言之,我希望能够搜索页面上数百个链接中的几个链接的文本内容(而不是 URL)中出现的特定单词。

有谁知道任何事情或知道如果不编程的话从头开始构建会有多么棘手?

谢谢!Toby

答案1

cd "$(mktemp -d)"
wget -r --span-hosts --level=1 <url>
grep -r "<search term>" .

(如果某些链接的网站不允许抓取,您可能还需要这样做-e robots=off,但与此同时,尝试这样做可能不是一个好主意)

相关内容