谢谢你的帮助。我不是程序员,但我了解基本原理。我需要在一堆 xml 文件中执行此操作。我确信 xpath pl 或 xtask 或使用正则表达式的某种组合可以完成此操作,但我迷茫了。有人有什么想法吗?谢谢!
范围如下:
将“scc_title”元素复制到“scc_comments”元素。scc_comments 元素通常为空。如果不是,我仍然需要它将其附加到当前内容。
<property name="scc_title" type="s">NEED TO COPY THIS TEXT</property>
<property name="scc_comments" type="s">AND PASTE IT HERE</property>
答案1
python
使用 和的另一种方法ElementTree
:
from __future__ import print_function
import sys
import xml.etree.ElementTree as ET
def main():
if len(sys.argv) < 3:
print("usage:", sys.argv[0], "input", "output")
sys.exit(1)
tree = ET.parse(sys.argv[1])
root = tree.getroot();
src = root.find(".//*[@name='scc_title']")
dst = root.find(".//*[@name='scc_comments']")
if src is not None and dst is not None:
dst.text += src.text
tree.write(sys.argv[2])
else:
if src is None:
print("Failed to find 'scc_title' attribute", file=sys.stderr)
if dst is None:
print("Failed to find 'scc_comments' attribute", file=sys.stderr)
sys.exit(1)
if __name__ == "__main__":
main()
答案2
Pythonic 非 xml 方式假设 scc_title 在 scc_comments 之前,并且每个标签都有自己的行,并且所有 XML 文件都位于同一目录中我没有测试过,但这是基本思想。另外,我不确定是否有快速的 GUI 方法,而且我也不是程序员,所以使用 xml 模块可能有更好的方法来实现这一点:
#put this in the directory with the xml files
import re
import os
#for file_name in current directory "."
for file_name in os.listdir("."):
if ".xml" in file_name:
outfile = open("edited_"+file_name,"w+")
with open(file_name,'r') as f:
for line in f:
if "scc_title" in line:
#split the string by two delimeters "<" and ">" and get the 3rd element starts at 0
scc_title_value = re.split('<|>',line)[2]
if "scc_comments" in line:
scc_comments_value = re.split('<|>',line)[2]
#replace scc_comments_value with scc_title_value
line = line.replace(scc_comments_value,scc_title_value)
outfile.write(line)