如何只查看网站内容而不查看源内容(HTML)?

如何只查看网站内容而不查看源内容(HTML)?

我尝试使用curl,但它显示了很多HTML 内容(源代码)。

我想知道是否可以查看网页的内容 - 例如包含一些信息的表格。

答案1

你可以使用links.

例如links -width 512 -dump http://www.example.com/

links可以为大多数(如果不是全部)Linux 发行版预先打包,并且带有源代码的主页位于http://links.twibright.com/

lynx是另一种选择,另一种带有选项的文本模式浏览器-dump。还为大多数/所有 Linux 发行版打包,主页位于http://lynx.invisible-island.net/

答案2

你可以尝试html2text。如果没有帮助,请提供更多信息。

答案3

在 LibreOffice Writer 等中打开源代码,您将获得可读格式的内容和格式,并且还可以将其导出为其他格式。但是,如果您想编写脚本,最好使用其他解决方案。

相关内容