在 Notepad++ (Np++) 中使用正则表达式查找 CamelCase / WikiWord 单词

Question 1

这尤其困难，因为你似乎没有遵循 CamelCase 风格，即首字母始终大写，并且允许多个连续的大写字母。唯一能涵盖你所有示例的定义是

Words containing at least two non-consecutive capital letters separated by 
lower case letters.

这意味着它还将捕获foObaR并非真正的 CamelCase 且可能不是您所需要的模式。

无论如何，下面的正则表达式符合您的所有示例*：

 [\(\[ ]([_\-\.a-z]*[A-Z][_\-\.a-zA-Z]+[A-Z]+[_\-\.a-z]*)[\)\] ]
  ----- - -------- - ---  ----------- - --- - -------- -- -----
    |   |     |    |  |        |      |  |  |     |    ||   |> Right boundary: 
    |   |     |    |  |        |      |  |  |     |    ||         ),] or space
    |   |     |    |  |        |      |  |  |     |    ||----> Close capture
    |   |     |    |  |        |      |  |  |     |    |-----> 0 or more
    |   |     |    |  |        |      |  |  |     |----------> Character class:
    |   |     |    |  |        |      |  |  |                   ,-,., or a to z
    |   |     |    |  |        |      |  |  |----------------> 1 or more    
    |   |     |    |  |        |      |  |-------------------> A to Z       
    |   |     |    |  |        |      |----------------------> 1 or more 
    |   |     |    |  |        |-----------------------------> Character class:
    |   |     |    |  |                                        ,-,., a to z 
    |   |     |    |  |                                        or A to Z
    |   |     |    |  |--------------------------------------> Capital letter
    |   |     |    |-----------------------------------------> 0 or more
    |   |     |----------------------------------------------> Character class:
    |   |                                                      ,-,., and a to z
    |   |----------------------------------------------------> Open capture
    |--------------------------------------------------------> Left boundary:
                                                               (,[ or space

* 我认为。我自己没有用过 notepad++，但是他们的网站说他们使用Perl 兼容正则表达式。以上是符合您所有示例的 PCRE。

Answer

这尤其困难，因为你似乎没有遵循 CamelCase 风格，即首字母始终大写，并且允许多个连续的大写字母。唯一能涵盖你所有示例的定义是

Words containing at least two non-consecutive capital letters separated by 
lower case letters.

这意味着它还将捕获foObaR并非真正的 CamelCase 且可能不是您所需要的模式。

无论如何，下面的正则表达式符合您的所有示例*：

 [\(\[ ]([_\-\.a-z]*[A-Z][_\-\.a-zA-Z]+[A-Z]+[_\-\.a-z]*)[\)\] ]
  ----- - -------- - ---  ----------- - --- - -------- -- -----
    |   |     |    |  |        |      |  |  |     |    ||   |> Right boundary: 
    |   |     |    |  |        |      |  |  |     |    ||         ),] or space
    |   |     |    |  |        |      |  |  |     |    ||----> Close capture
    |   |     |    |  |        |      |  |  |     |    |-----> 0 or more
    |   |     |    |  |        |      |  |  |     |----------> Character class:
    |   |     |    |  |        |      |  |  |                   ,-,., or a to z
    |   |     |    |  |        |      |  |  |----------------> 1 or more    
    |   |     |    |  |        |      |  |-------------------> A to Z       
    |   |     |    |  |        |      |----------------------> 1 or more 
    |   |     |    |  |        |-----------------------------> Character class:
    |   |     |    |  |                                        ,-,., a to z 
    |   |     |    |  |                                        or A to Z
    |   |     |    |  |--------------------------------------> Capital letter
    |   |     |    |-----------------------------------------> 0 or more
    |   |     |----------------------------------------------> Character class:
    |   |                                                      ,-,., and a to z
    |   |----------------------------------------------------> Open capture
    |--------------------------------------------------------> Left boundary:
                                                               (,[ or space

* 我认为。我自己没有用过 notepad++，但是他们的网站说他们使用Perl 兼容正则表达式。以上是符合您所有示例的 PCRE。

Question 2

克雷格--

我认为上面的方法并不适用于 Notepad++ 中的所有情况。如果您尚未找到答案，请尝试以下变体：

([(\[\s])([a-z0-9_.\-]*[A-Z]+[a-z0-9_.\-]+[A-Z]+[a-z0-9_.\-]*)([)\]\s])

这还将匹配边界字符 -- []、()或空格 ( \s) -- 以确保您只获取想要捕获的 WikiWords。在“查找”字段中使用该字符串，并在“替换”字段中使用此字符串：

\1/\2\3

...最后你应该用（例如）来(/MyWikiWords)代替(MyWikiWords)。

如果您有一些 WikiWords 出现在括号或圆括号的上下文之外，您可以尝试此搜索：

\b([a-z0-9_.\-]*[A-Z]+[a-z0-9_.\-]+[A-Z]+[a-z0-9_.\-]*)\b

...替换部分如下：

/\1

...使用单词边界（\b）正则表达式。

Answer