删除“ ”标签之间的文本，其中“ ”可能位于不同行

Question 1

要从 XML 文档中删除注释，您可以使用xmlstarlet：

xmlstarlet ed -d '//comment()' file.xml

注释是否跨越多行并不重要。

该工具通过其( ) 选项xmlstarlet支持就地编辑。-L--inplace

Answer

要从 XML 文档中删除注释，您可以使用xmlstarlet：

xmlstarlet ed -d '//comment()' file.xml

注释是否跨越多行并不重要。

该工具通过其( ) 选项xmlstarlet支持就地编辑。-L--inplace

Question 2

我会用perl：

perl -0777 -pe 's/<!--.*?-->//sg' < your-file

where-p启用该sed模式，-0777将记录分隔符更改为不可能的字符，这意味着整个文件被作为一条记录处理（slurp 模式），并将正则表达式s///sg的所有匹配项替换为空，该s标志.也匹配换行符，并g替换所有发生的事情，而不仅仅是第一次。

它并不关心输入是否是有效的 XML，因为它不会尝试将输入解析为 XML，因此即使输入不是有效的 XML，它也会工作，但从理论上讲，它最终可能会删除那些例如，如果这些出现，则不是 XML 注释。<!CDATA[

使用sed，您可以执行类似的操作：

sed ':1
     $!{
       N;b1
     }
     s/_/_u/g; s/(/_</g; s/)/_>/g; # escape _, ( and ) characters
     s/<!--/(/g; s/-->/)/g; # replace <!-- and --> with
                            # single characters ( and )

     s/([^)]*)//g; # remove the comments

     s/)/-->/g; s/(/<!--/g; # revert earlier replacement
     s/_>/)/g; s/_</(/g; s/_u/_/g; # revert earlier escaping'

由于标准sed没有perl的*?运算符（的非贪婪版本*），因此我们只能使用 using([^)]*)来匹配 on ，(后跟任意数量的字符，而不是)在)替换了with后)，保存后本身(和字符 )最初在输入中为_<and _>（和_as _u）。

请注意预先将整个输入吸入模式空间的循环（请注意，某些sed实现对模式空间的大小有下限，但 GNU 没有sed）。

Answer