我想要使用某个小部件在互联网上搜索网站。
Google 已经抓取了互联网,但他们的标准搜索会删去所有代码片段,只留下人类可读的文本进行搜索。
有没有办法利用现有的互联网爬虫并搜索 HTML 代码中不属于网站内容(即文本)的关键词?
答案1
我相信谷歌几年前就删除了很多这种功能。黑客/破解者用它来搜索运行已知漏洞的特定软件的网站,然后利用这些网站。
我很好奇——您的用例是什么?
我想要使用某个小部件在互联网上搜索网站。
Google 已经抓取了互联网,但他们的标准搜索会删去所有代码片段,只留下人类可读的文本进行搜索。
有没有办法利用现有的互联网爬虫并搜索 HTML 代码中不属于网站内容(即文本)的关键词?
我相信谷歌几年前就删除了很多这种功能。黑客/破解者用它来搜索运行已知漏洞的特定软件的网站,然后利用这些网站。
我很好奇——您的用例是什么?