如何从 Linux 命令行将 HTML 标签转换为 RTF 或任何富格式文本

如何从 Linux 命令行将 HTML 标签转换为 RTF 或任何富格式文本

sed如何使用或任何 Linux 命令行工具将 HTML 标签转换为 rtRTF 或任何富格式文本?

我已经成功地用 剥离了它们sed 's/<[^>]*>//g',但我需要 来<b>hi</b>转换为**hi**

答案1

html2text是一个将 HTML 转换为 Markdown 的命令行工具。

尝试使用sed这个方法而不出错,你很可能会感到非常沮丧。原因在传奇的SO帖子. 在非常基本的情况下可能工作,但是它将要如果你养成了习惯,它就会回来困扰你,所以直接学习如何正确地做到这一点。使用现成的工具(如 html2text)比手动尝试正则表达式要好得多。

相关内容