我正在尝试在 Bash 中从 XML 文件生成一棵树。
这是 XML 文件的一部分:
<menu name="main_menu" display="Main Menu">
<application name="load_profiles" display="Load Profile"/>
<application name="save_profiles" display="Save Profile"/>
<application name="remove_profiles" display="Delete Profile"/>
</menu>
我曾尝试使用 CAT、GREP 和 AWK:
cat menu.xml | grep menu\ name | awk -v FS="(display=\"|\" help)" '{print $2}' > menulist.txt
我首先使用包含“菜单名称”的行进行 GREP 搜索,然后打印“display="'和'”help' 之间的测试,得到以下输出:
Main Menu">
Broadband
Load and Save Profiles
xDSL Interface
但我想要的是 Grep 所有包含“菜单名称”、“参数类型”、“应用程序名称”和“值 ID”的行,并在树状输出中打印它们的显示名称。我不确定如何从多行 Grep 多个值并从中打印特定字符串。
然后我发现使用 XML 解析器工具来执行此操作相对容易。所以我尝试使用 XMLStarlet:
xmlstarlet el menu.xml | awk -F'/' 'BEGIN{print "digraph{"}{print $(NF-1)" -> "$NF}END{print"}"}' > menumenutxt.txt
使用此命令我发现以下输出:
menu -> menu
menu -> onenter
menu -> menu
menu -> application
menu -> application
menu -> application
menu -> parameter
parameter -> value
parameter -> value
这看起来确实更好,更接近我想要的。但它没有打印显示名称。
我想要打印的内容如下:
Main Menu ->
-> Broadband
-> Load and Save Profiles
-> Load Profile
-> Save Profile
-> Delete Profile
或者以下内容:
Main Menu
-> Broadband
--> Load and Save Profiles
---> Load Profile
---> Save Profile
---> Delete Profile
我的目标是获得尽可能接近它的输出。有人能建议我该怎么做吗?
答案1
改编自xmlstarlet 文档:
xmlstarlet sel -T -t -m '//*' \
-i '@display' \
-m 'ancestor-or-self::*' \
-i '(position()=last())' \
-o '-> ' -v '@display' -b \
-o $'\t' -b \
-n foo.xml
例如:
使用 xml sel 打印 XML 元素的结构(高级 XPath 表达式和 xml sel 命令用法)
xml sel -T -t -m '//*' \ -m 'ancestor-or-self::*' -v 'name()' -i 'not(position()=last())' -o . -b -b -n \ xml/structure.xml
结果输出:
a1 a1.a11 a1.a11.a111 a1.a11.a111.a1111 a1.a11.a112 a1.a11.a112.a1121 a1.a12 a1.a13 a1.a13.a131
从这里开始,我们需要修改的内容是:
- 打印
display
属性而不是name
,因此@display
而不是name()
- 只打印最后一个元素。我们已经测试过打印
.
除最后一个元素之外的所有元素,因此很容易将其反转。 - 打印制表符以缩进(我们可以在每个元素之后执行此操作,它只会留下尾随的、不可见的制表符),因此在 bash 中只需输入
-o $'\t'
.$'\t'
就会得到一个制表符。 - 仅打印具有该
display
属性的元素,因此-i '@display'
我缩进了上面的命令以使流程更清晰。
我得到的输出:
$ xmlstarlet sel -T -t -m '//*' -i '@display' -m 'ancestor-or-self::*' -i '(position()=last())' -o '-> ' -v '@display' -b -o $'\t' -b -n foo.xml
-> English
-> Main Menu
-> Broadband
-> Load and Save Profiles
-> Load Profile
-> Save Profile
-> Delete Profile
-> Interface
-> xDSL
-> SFP
-> Ethernet
-> SHDSL
-> xDSL Interface
-> xDSL Mode
-> Annex A/M
-> Annex B/J
-> MAC Address
-> MAC Address
-> Vectoring Mode
-> Disabled
-> Enabled
-> Friendly
-> G.FAST
-> Disabled
-> Enabled
经过一番思考,以下更简单:
xmlstarlet sel -T -t -m '//*' \
-i '@display' \
-m 'ancestor::*' \
-o $'\t' -b \
-o '-> ' -v '@display' -n foo.xml
使用ancestor::*
而不是可以ancestor-or-self::*
更容易地正确打印标签,并消除对最后一个元素的额外测试。
类似的输出,但没有尾随制表符:
-> English
-> Main Menu
-> Broadband
-> Load and Save Profiles
-> Load Profile
-> Save Profile
-> Delete Profile
-> Interface
-> xDSL
-> SFP
-> Ethernet
-> SHDSL
-> xDSL Interface
-> xDSL Mode
-> Annex A/M
-> Annex B/J
-> MAC Address
-> MAC Address
-> Vectoring Mode
-> Disabled
-> Enabled
-> Friendly
-> G.FAST
-> Disabled
-> Enabled
答案2
(如果尚未安装,请安装 xidel)
xidel ex.xml \
-e '//@display/concat(substring("------",1,count(ancestor::*)),">",.)'
substring("------",1,n)
是用 n 个“-”构建字符串的一种肮脏的方法