将 XML 转换为 CSV shell 命令行

将 XML 转换为 CSV shell 命令行

我有一个大型 XML 文件 (600MB),我想通过终端命令将其转换为 CSV。我尝试使用以下语法通过 xml2 命令将 XML 转换为 TXT。

xml2 <BIG.xml > BIG.txt

我的 XML 格式是

<ReportDetails>
    <Date>08/08/2012</Date>
    <CaseNo>13030903</CaseNo>
    <UserDetailsText>Individual Details</UserDetailsText>
    <UserDetails>
        <UserId>0903</UserId>    
        <FirstName>John</FirstName>
        <Surname>Perry</Surname>
        <Occupation>Developer</Occupation>
        <DateofBirth>02/14/1981</DateofBirth>    
    </UserDetails>
    <ApplicationDetailsText>Conflict Resolution Details</ApplicationDetailsText>
    <ApplicationDetails>
        <ApplicationNo>13033</ApplicationNo>
        <ApplicationName>John Perry</ApplicationName>
        <Department>Information Technology</Department>
        <ApplicationType>Personal</ApplicationType>
        <ApplicationDate>06/07/2012</ApplicationDate>
        <ApplicationEndDate>09/07/2012</ApplicationEndDate>
        <ApplicationStatus>Closed</ApplicationStatus>    
     </ApplicationDetails>  
</ReportDetails>

我希望 CSV 文件中的这些字段用竖线 (|) 分隔

日期 | 案件编号 | 名字 | 姓氏 | 申请编号 | 申请名称 | 申请日期 | 申请状态

另外,如果我想通过 PHP 文件执行该文件,我需要一个 shell 脚本来执行该操作。

答案1

使用 XSL 转换为您需要的精确格式;例如,

<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="iso-8859-1"/>
<xsl:strip-space elements="*" />

<xsl:template match="/ReportDetails">
  <xsl:value-of select="Date"/><xsl:text>|</xsl:text>
  <xsl:value-of select="CaseNo"/><xsl:text>|</xsl:text>
  <xsl:apply-templates select="UserDetails" />
</xsl:template>

<xsl:template match="/ReportDetails/UserDetails">
  <xsl:value-of select="FirstName"/><xsl:text>|</xsl:text>
  <xsl:value-of select="Surname"/><xsl:text>|</xsl:text>
</xsl:template>

<!-- etc -->
</xsl:stylesheet>

然后给定上述内容(例如,在 foo.xsl 中转换原始 xml 文档 foo.xml):

$ xsltproc  foo.xsl  foo.xml 
08/08/2012|13030903|John|Perry|

(魔鬼藏在 xsl 的细节中……有很多方法可以实现这一点……)

相关内容