我有 2 个 XML 文件。
1.xml
<abc>
....
....
</abc>
<xyz attrib1='1234'>
...
...
</xyz>
2.xml
<abc>
xxx
xxx
</abc>
<xyz attrib2='4321'>
xxx
xxxx
</xyz>
我需要使用 shell 脚本将文件 1.xml 中“xyz”标签的内容替换为 2.xml 中的内容,以给出最终文件,例如:
<abc>
....
....
</abc>
<xyz attrib2='4321'>
xxx
xxxx
</xyz>
答案1
和sed
:
sed -n '/<xyz[ >]/,/<\/xyz>/p' 2.xml | \
sed '/<xyz[ >]/,/<\/xyz>/ { /<\/xyz>/! d; r /dev/stdin
D; }' 1.xml >output.xml
请注意,后面必须有一个换行符/dev/stdin
。
sed
另一种更干净但效率较低的方法:
{
sed '/<xyz[ >]/,$d' 1.xml
sed -n '/<xyz[ >]/,/<\/xyz>/p' 2.xml
sed '1,/<\/xyz>/d' 1.xml
} >output.xml
答案2
执行此操作的正确(虽然冗长)方法是使用 XML 感知实用程序,而不是通用文本处理工具。
例如,使用 XSTL 转换xslt过程:
xsltproc - 1.xml <<EOF
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<!-- Identity template (copy input to output) -->
<xsl:template match="@*|node()">
<xsl:copy>
<xsl:apply-templates select="@*|node()"/>
</xsl:copy>
</xsl:template>
<!-- Replace //xyz with its counterpart from 2.xml -->
<xsl:template match="//xyz">
<xsl:copy-of select="document('2.xml')//xyz"/>
</xsl:template>
</xsl:stylesheet>
EOF
这将正确替换//xyz
为1.xml
2.xml //xyz
,无论文本编码、格式、实体引用的使用等如何
答案3
sed "
/<xyz/,/<\/xyz>/c\
$(
sed -n '
/<xyz/{
:a;
N;
/<\/xyz>/! ba;
s/\n/\\&/gp;
}
' 2.xml
)
" 1.xml
对我来说,很容易从2.xml并将 ( c
) 中的适当行替换为1.xml
注意:c
命令无法接受多行输入,因此我们必须\
在行之间添加。
答案4
perl -0777ne ' # slurp xmls
$tag2 or ($tag2) = /(<xyz.*<\/xyz>)/s; # grab tag <xyz> from 2.xml
@ARGV or print s|<xyz.+?</xyz>|$tag2|srg; # replace tag <xyz> in 1.xml globally
' 2.xml 1.xml