我正在寻找一种在命令行中从 html 文件中提取全文的方法。这样做的目的是为我的 i3 状态栏制作一个 blocklet。
我发现了一些名称类似于“全文 RSS”的网站,但它总是输出一些 html...
答案1
有 html2text 的脚本,但我认为您正在寻找的是 xpath (例如 xmllint 支持它)来获取 html 页面的某些元素的内容。
我正在寻找一种在命令行中从 html 文件中提取全文的方法。这样做的目的是为我的 i3 状态栏制作一个 blocklet。
我发现了一些名称类似于“全文 RSS”的网站,但它总是输出一些 html...
有 html2text 的脚本,但我认为您正在寻找的是 xpath (例如 xmllint 支持它)来获取 html 页面的某些元素的内容。