我尝试删除多个 html 文件中的页脚部分。为简单起见,我从一个文件开始。该文件包含:
<footer id="footer">
...
</footer>
我尝试过hxremove footer foo.html
,但它没有输出任何内容。
答案1
这些命令从标准输入到标准输出。你必须像使用它们一样
hxremove selector <src.html >dst.html
。我的测试表明它们至少需要一点有效的 html(
<html>
,<body>
应该像往常一样在其中)。在这里你必须给出一个有效的 (x)html 选择器。
footer
在这种情况下没问题,所以它应该可以工作。
我的例子:
t.html:
<html>
<body>
<a>cica</a>
<p>cica</p>
<p>cica</p>
</body>
</html>
然后命令hxremove 'p' <t.html
输出正确
<html>
<body>
<a>cica</a>
</body>
</html>
所以,它可以工作,只是你必须多玩一点。
您可以使用hxnormalize
同一软件包中的工具来确保 xhtml 处理器眼中的情况如何:该命令hxnormalize <t.html
输出以下内容:
<html>
<body>
<p><a>cica</a>
<p>cica
<p>cica
看似不需要的空行是正确的行为- 选择器仅删除 html 部分,而不删除它们之间的文本(这次是空格)。