如何使用 sed 从文件中删除 html 标签？

Question 1

如果你不坚持的话sed，最好的办法就是这样做lynx。

lynx --dump <filename>.html

这将以 html 代码想要显示的格式输出 html 文件的内容。唯一的条件是文件名应该有一个.html或.htm扩展名。

Answer

如果你不坚持的话sed，最好的办法就是这样做lynx。

lynx --dump <filename>.html

这将以 html 代码想要显示的格式输出 html 文件的内容。唯一的条件是文件名应该有一个.html或.htm扩展名。

Question 2

只要您的 HTML 标记仅限于一行，以下内容就可以工作：

sed 's/<[^>]*>//g'

Answer

只要您的 HTML 标记仅限于一行，以下内容就可以工作：

sed 's/<[^>]*>//g'

Question 3

我强烈建议使用名为html2text(1) (2）反而。解析 HTML 比看起来要困难得多。

Answer

我强烈建议使用名为html2text(1) (2）反而。解析 HTML 比看起来要困难得多。

相关内容