过滤html标签

过滤html标签

使用从 chrome 或其他保存的 html 书签,经常导出为 html 文件,其中带有<a href我想要过滤和排列的标签:

<a href="https://<a-web-site>">Title of the website</a>

如何使用 sed/grep/awk 等基本 Linux 实用程序来过滤和排列项目,例如:

Title of the website https://<a-web-site>

答案1

使用 sed:

$ echo '<a href="https://<a-web-site>">Title of the website</a>' | sed -e 's|.*href="\(.*\)".*>\(.*\)</a>|\2 \1|g'
Title of the website https://<a-web-site>

相关内容