如何从巨大 (>2gb) XML 文件中删除节点？

Question 1

您可以使用 awk：

$cat my.xml | awk '/<b>/{hide=1} /<\/record>/ {hide=0} {if (hide==0) print;}' >mynew.xml

这将隐藏自包含行以来的所有内容<b>，并以包含行开始显示</record>

根据您的评论，如果您的 XML 是一大行 - 只需将其拆分为几行，并在完成转换后删除换行符。

$cat my.xml|sed 's/>/>\n/g'| awk ....... | tr -d '\n' >.....

扔掉 xml，开始使用 YAML 或 JSON！

Answer

您可以使用 awk：

$cat my.xml | awk '/<b>/{hide=1} /<\/record>/ {hide=0} {if (hide==0) print;}' >mynew.xml

这将隐藏自包含行以来的所有内容<b>，并以包含行开始显示</record>

根据您的评论，如果您的 XML 是一大行 - 只需将其拆分为几行，并在完成转换后删除换行符。

$cat my.xml|sed 's/>/>\n/g'| awk ....... | tr -d '\n' >.....

扔掉 xml，开始使用 YAML 或 JSON！

Question 2

就我个人而言，我会在 C 中做一些事情（在汇编之前可能处于最低级别）并使用 libxml 循环遍历所有节点。

使用 GCC 编译您的代码。

Answer

就我个人而言，我会在 C 中做一些事情（在汇编之前可能处于最低级别）并使用 libxml 循环遍历所有节点。

使用 GCC 编译您的代码。

相关内容