wget 从 HTML 端获取特定的 TEXT 字符串

wget 从 HTML 端获取特定的 TEXT 字符串

我想将 HTML 站点中的某一行复制到 TXT 文件中。

例如http://www.bafg.de/php/KOBLENZRHEINW.htm

总是包含以下行:

Letzter gemessener Wert : 221 cm um 15:30 Uhr MEZ am 5.09.2017

我怎样才能做到这一点?

答案1

此命令将wget的输出定向到控制台,grep选择所选的行并最终将其重定向到文件.txt

wget -q -O - "$@" http://www.bafg.de/php/KOBLENZRHEINW.htm | grep "Letzter gemessener Wert" > file.txt

答案2

wget http://www.bafg.de/php/KOBLENZRHEINW.htm && grep "Letzter gemessener Wert" KOBLENZRHEINW.htm > wert.txt

如果行总是以“Letzter gemessener Wert”开头,则应该可以解决问题。它会下载文件.htm,搜索行并将输出保存在 中wert.txt。使用 just >will覆写任何现有文件wert.txt,如果您想将该行附加到文件,请使用>>

但是,zx485 将网站文本直接传输到管道的方式grep比我上面的解决方案中先下载文件更好。

相关内容