将 2 个标签之间的 XML 内容从一个文件复制到另一个文件

将 2 个标签之间的 XML 内容从一个文件复制到另一个文件

我有 2 个 XML 文件。

1.xml

<abc>
....
....
</abc>

<xyz attrib1='1234'>
...
...
</xyz>

2.xml

<abc>
xxx
xxx
</abc>
<xyz attrib2='4321'>
xxx
xxxx
</xyz>

我需要使用 shell 脚本将文件 1.xml 中“xyz”标签的内容替换为 2.xml 中的内容,以给出最终文件,例如:

<abc>
    ....
    ....
    </abc>
    <xyz attrib2='4321'>
    xxx
    xxxx
    </xyz>

答案1

sed

sed -n '/<xyz[ >]/,/<\/xyz>/p' 2.xml | \
sed '/<xyz[ >]/,/<\/xyz>/ { /<\/xyz>/! d; r /dev/stdin
    D; }' 1.xml >output.xml

请注意,后面必须有一个换行符/dev/stdin

sed另一种更干净但效率较低的方法:

{
    sed '/<xyz[ >]/,$d' 1.xml
    sed -n '/<xyz[ >]/,/<\/xyz>/p' 2.xml
    sed '1,/<\/xyz>/d' 1.xml
} >output.xml

答案2

执行此操作的正确(虽然冗长)方法是使用 XML 感知实用程序,而不是通用文本处理工具。

例如,使用 XSTL 转换xslt过程

xsltproc - 1.xml <<EOF
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <!-- Identity template (copy input to output) -->
    <xsl:template match="@*|node()">
    <xsl:copy>
        <xsl:apply-templates select="@*|node()"/>   
    </xsl:copy>
    </xsl:template>

    <!-- Replace //xyz with its counterpart from 2.xml -->
    <xsl:template match="//xyz">
        <xsl:copy-of select="document('2.xml')//xyz"/>
    </xsl:template>
</xsl:stylesheet>
EOF

这将正确替换//xyz1.xml2.xml //xyz,无论文本编码、格式、实体引用的使用等如何

答案3

sed "
    /<xyz/,/<\/xyz>/c\
        $(
            sed -n '
                /<xyz/{
                    :a;
                    N;
                    /<\/xyz>/! ba;
                    s/\n/\\&/gp;
                    }
                ' 2.xml
        )
    " 1.xml

对我来说,很容易从2.xml并将 ( c) 中的适当行替换为1.xml 注意:c命令无法接受多行输入,因此我们必须\在行之间添加。

答案4

perl -0777ne '                                # slurp xmls
   $tag2 or ($tag2) = /(<xyz.*<\/xyz>)/s;     # grab tag <xyz> from 2.xml
   @ARGV or print s|<xyz.+?</xyz>|$tag2|srg;  # replace tag <xyz> in 1.xml globally
' 2.xml 1.xml

相关内容