如何在网站上查找某个电子邮件地址的所有出现位置

如何在网站上查找某个电子邮件地址的所有出现位置

假设我有一个大型网站,上面可能有许多电子邮件地址被垃圾邮件发送者窃取。我计划混淆或删除所有这些地址。

爬取我的网站以查找我可能暴露的电子邮件地址的最简单方法是什么?

无论是通过页面上的文本(Google 可以获取,但效果不是很好),还是通过 mailto: 链接(Google 不能)。

答案1

就像是:

wget --mirror --html-extension http://www.mydomain.org/ -o /home/user/temp_site/

然后

grep -Hinr "@mydomain.org" /home/user/temp_site/ > /home/user/list_of_pages_with_email

应返回包含您的域名电子邮件地址的所有页面(带有行号)的列表。

可能需要进行调整。

手册获得grep

相关内容