我有一个大型 XML 文件 (600MB),我想通过终端命令将其转换为 CSV。我尝试使用以下语法通过 xml2 命令将 XML 转换为 TXT。
xml2 <BIG.xml > BIG.txt
我的 XML 格式是
<ReportDetails>
<Date>08/08/2012</Date>
<CaseNo>13030903</CaseNo>
<UserDetailsText>Individual Details</UserDetailsText>
<UserDetails>
<UserId>0903</UserId>
<FirstName>John</FirstName>
<Surname>Perry</Surname>
<Occupation>Developer</Occupation>
<DateofBirth>02/14/1981</DateofBirth>
</UserDetails>
<ApplicationDetailsText>Conflict Resolution Details</ApplicationDetailsText>
<ApplicationDetails>
<ApplicationNo>13033</ApplicationNo>
<ApplicationName>John Perry</ApplicationName>
<Department>Information Technology</Department>
<ApplicationType>Personal</ApplicationType>
<ApplicationDate>06/07/2012</ApplicationDate>
<ApplicationEndDate>09/07/2012</ApplicationEndDate>
<ApplicationStatus>Closed</ApplicationStatus>
</ApplicationDetails>
</ReportDetails>
我希望 CSV 文件中的这些字段用竖线 (|) 分隔
日期 | 案件编号 | 名字 | 姓氏 | 申请编号 | 申请名称 | 申请日期 | 申请状态
另外,如果我想通过 PHP 文件执行该文件,我需要一个 shell 脚本来执行该操作。
答案1
使用 XSL 转换为您需要的精确格式;例如,
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="iso-8859-1"/>
<xsl:strip-space elements="*" />
<xsl:template match="/ReportDetails">
<xsl:value-of select="Date"/><xsl:text>|</xsl:text>
<xsl:value-of select="CaseNo"/><xsl:text>|</xsl:text>
<xsl:apply-templates select="UserDetails" />
</xsl:template>
<xsl:template match="/ReportDetails/UserDetails">
<xsl:value-of select="FirstName"/><xsl:text>|</xsl:text>
<xsl:value-of select="Surname"/><xsl:text>|</xsl:text>
</xsl:template>
<!-- etc -->
</xsl:stylesheet>
然后给定上述内容(例如,在 foo.xsl 中转换原始 xml 文档 foo.xml):
$ xsltproc foo.xsl foo.xml
08/08/2012|13030903|John|Perry|
(魔鬼藏在 xsl 的细节中……有很多方法可以实现这一点……)