是否有一个工具可以从 html 文件中删除所有超链接?

是否有一个工具可以从 html 文件中删除所有超链接?

在 Ubuntu 中有没有办法做到这一点?我读过在 php 中可以做到这一点,但我对 php 一点也不熟悉。

答案1

您可以使用sed它,但它只适用于 html 代码中单行的链接。

更新:

该死的贪婪的正则表达式!;) 这个现在应该可以工作了!

sed -i 's|<a[^>]\+>|<a>|g' <the-html-file>

答案2

取决于您要做什么:

如果您的机器上有一堆文件,并且您想删除链接,请使用类似 wee perl 脚本的方法来删除标签<a ...> ... </a>。您可以用类似的方法删除其他标签(甚至所有标签)。使用正确的模式匹配选项,此方法可以处理跨多行拆分的标签。(这种方法非常优雅,但本文的空白处无法展示详细信息)。

如果您尝试使用 Firefox(或其他浏览器)浏览某个网络服务器上的文件,那么某种在显示页面之前自动动态修改页面的greasemonkey 脚本可能就是您想要的。

相关内容