通过 HTML 解析器从 HTML 中提取值

通过 HTML 解析器从 HTML 中提取值

我最初询问了一种直接从 HTML 文件使用grep/的方法。awk我收到了一些反馈,但我发现人们没有完整的 HTML,因此建议的解决方案失败了。

有些人提到 HTML 解析将是一个更好的选择。我在使用标准 Linux/Debian Wheezy 的 Raspberry Pi 上工作。

提到的 HTML 可以在这里找到,简单的 HTML...但我想查看整个文件以便提供帮助很重要:

https://www.dropbox.com/s/9jdgzen2hwjxhjp/main.htm

所以需要做的是:

  • 提取两个值 Pplus 和 Pminus(18.0000 和 0.00000)并提供它们,并提供 SUM。
  • 这两个值均来自智能电表(电能表),该智能电表提供生成的能量 P- 和从网络获取的能量/功率 P+。
  • P-在有太阳和太阳能发电厂工作的情况下,所以18W是在晚上,0.0000意味着没有太阳,所以不发电,只是给你一些背景信息。

我尝试在原始线程中更新并请求支持,但似乎没有人再看到它,因为过去几天没有任何新的反馈。我现在尝试将这个问题带回给这里的专家。

答案1

查看这个示例 HTML 文件:

<DIV ID="idButtonDiv" STYLE="top:143px; left:0px;" ALIGN="CENTER">
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0"><TR><TD ID="idButtonTd">
18.000

</TD></TR></TABLE>
</DIV>

看起来这并不容易解析。

相关内容