Notepad++ 和 xml - 替换

Question 1

是的，很可能是.*太“贪婪”了，捕获了尽可能多的字符尽可能地；你需要相反的——最短的匹配。

一种方法是使用[^>]*代替——这仍然会匹配尽可能多的内容，但只匹配到第一个>，因此<ITEM_([^>]*)>只会匹配开始标签，仅此而已。

根据正则表达式语法，.*?也可能有效 - 这明确地将其切换*为“非贪婪”。

Answer

是的，很可能是.*太“贪婪”了，捕获了尽可能多的字符尽可能地；你需要相反的——最短的匹配。

一种方法是使用[^>]*代替——这仍然会匹配尽可能多的内容，但只匹配到第一个>，因此<ITEM_([^>]*)>只会匹配开始标签，仅此而已。

根据正则表达式语法，.*?也可能有效 - 这明确地将其切换*为“非贪婪”。

Question 2

感谢 Gravity，它帮助我扩大了搜索范围这里在一个正则表达式中涵盖多个搜索和替换。

尝试以下方法可行：

Find: </ITEM_.*(>)|<ITEM_(.*)(>)
Replace: (?1</ITEM>)(?2<ITEM>\n<ID>\2</ID>)
RegEx

| 分隔要查找的两个字符串，而 ?1 和 ?2 分别是它们的替换值。

但我必须先查找结束</ITEM标记，而不是<ITEM您逻辑上认为的标记。所以我有一个解决方案，但有人能回答这个问题吗？为什么上面的方法有效，而下面的方法（先查找<ITEM标记）在我们只是反转查找顺序时失败了？

Find: <ITEM_(.*)(>)|</ITEM_.*(>)
Replace: (?1<ITEM>\n<ID>\1</ID>)(?2</ITEM>
RegEx

不是必需的，但好奇的人可能想知道。谢谢。

Answer

感谢 Gravity，它帮助我扩大了搜索范围这里在一个正则表达式中涵盖多个搜索和替换。

尝试以下方法可行：

Find: </ITEM_.*(>)|<ITEM_(.*)(>)
Replace: (?1</ITEM>)(?2<ITEM>\n<ID>\2</ID>)
RegEx

| 分隔要查找的两个字符串，而 ?1 和 ?2 分别是它们的替换值。

但我必须先查找结束</ITEM标记，而不是<ITEM您逻辑上认为的标记。所以我有一个解决方案，但有人能回答这个问题吗？为什么上面的方法有效，而下面的方法（先查找<ITEM标记）在我们只是反转查找顺序时失败了？

Find: <ITEM_(.*)(>)|</ITEM_.*(>)
Replace: (?1<ITEM>\n<ID>\1</ID>)(?2</ITEM>
RegEx

不是必需的，但好奇的人可能想知道。谢谢。

Question 3

Ctrl+H
找什么：<ITEM_(\d+)>([\s\S]*)</ITEM_\1>
用。。。来代替：<ITEM>\n<ID>$1</ID>$2</ITEM>
查看相符
查看环绕
查看 正则表达式
取消选中 . matches newline
Replace all

解释：

<ITEM_          # literally
(\d+)           # group 1, 1 or more digits, you can use [^>]* if other characters than digits are allowed
>               # literally
([\s\S]*)       # group 2, 0 or more any character, including linebreaks
</ITEM_         # literally
\1              # backreference to group 1
>               # literally

替代品：

<ITEM>          # literally
\n              # linefeed, use \r\n for windows EOL
<ID>$1</ID>     # ID tag, with the content of group 1
$2              # content of group 2
</ITEM>         # literally

截图（之前）：

截图（之后）：

Answer

Ctrl+H
找什么：<ITEM_(\d+)>([\s\S]*)</ITEM_\1>
用。。。来代替：<ITEM>\n<ID>$1</ID>$2</ITEM>
查看相符
查看环绕
查看 正则表达式
取消选中 . matches newline
Replace all

解释：

<ITEM_          # literally
(\d+)           # group 1, 1 or more digits, you can use [^>]* if other characters than digits are allowed
>               # literally
([\s\S]*)       # group 2, 0 or more any character, including linebreaks
</ITEM_         # literally
\1              # backreference to group 1
>               # literally

替代品：

<ITEM>          # literally
\n              # linefeed, use \r\n for windows EOL
<ID>$1</ID>     # ID tag, with the content of group 1
$2              # content of group 2
</ITEM>         # literally

截图（之前）：

截图（之后）：

Notepad++ 和 xml - 替换

答案1

答案2

答案3

相关内容