如何使用 hxremove 正确删除页脚?

如何使用 hxremove 正确删除页脚?

我尝试删除多个 html 文件中的页脚部分。为简单起见,我从一个文件开始。该文件包含:

<footer id="footer">
...
</footer>

我尝试过hxremove footer foo.html,但它没有输出任何内容。

答案1

  1. 这些命令从标准输入到标准输出。你必须像使用它们一样hxremove selector <src.html >dst.html

  2. 我的测试表明它们至少需要一点有效的 html(<html><body>应该像往常一样在其中)。

  3. 在这里你必须给出一个有效的 (x)html 选择器footer在这种情况下没问题,所以它应该可以工作。

我的例子:

t.html:

<html>
  <body>
    <a>cica</a>
    <p>cica</p>
    <p>cica</p>
  </body>
</html>

然后命令hxremove 'p' <t.html输出正确

<html>
  <body>
    <a>cica</a>


  </body>
</html>

所以,它可以工作,只是你必须多玩一点。

您可以使用hxnormalize同一软件包中的工具来确保 xhtml 处理器眼中的情况如何:该命令hxnormalize <t.html输出以下内容:

<html>
  <body>
    <p><a>cica</a>

    <p>cica

    <p>cica

看似不需要的空行是正确的行为- 选择器仅删除 html 部分,而不删除它们之间的文本(这次是空格)。

相关内容