提取两个 XML 标记之间的文本

提取两个 XML 标记之间的文本

我有一个日志文件,里面有我正在进行的邮件系统迁移的错误。我需要获取用户迁移错误日志,并使它们可供最终用户阅读。一个日志文件可能包含一百个错误。每个错误都是 XML 格式。标签周围通常有大量无关的文本,但重要的内容在主题和日期标签之间。解析此文件并将输出放入另一个文件的最佳方法是什么?

消息主题 2010 年 3 月 11 日 ....更多标签

答案1

我不知道您对 Java 有何看法,但如果您有兴趣,可以查看这些教程。

教程 1 教程 2

如果不是,Google 的好关键词是 Sax 解析和 DOM 解析。如果你想了解两者之间的深入差异,你可以在 Wikipedia 上阅读它们。对于处理 100 个错误,我认为两者之间的差异很小。

答案2

许多语言都内置了 xml 解析器。根据您选择的语言,您可能需要查看它提供的内容。

答案3

回答:XSLT

您可以编写一个 XSLT 或让别人为您编写一个,它可以将任何源 XML 文件或文本转换为不同的文本输出。通常,XSLT 用于将 XML 转换为不同的 XML 格式或 HTML/XHTML,但也可用于生成 CSV 或其他类型的纯文本输出。现在请注意,XSLT 不是最直观的 XML 语法,而且相当冗长,但它非常强大,创建可以执行您所描述的操作并提取两部分数据并放置在纯文本文件中的东西应该不超过 15 行左右。

相关内容