对单词边界感到困惑

Question 1

如上所述这里，例如，它匹配之间字：

三种不同的位置都可以作为单词边界：

如果第一个字符是单词字符，则在字符串中的第一个字符之前。

在字符串中的最后一个字符之后，如果最后一个字符是单词字符。

字符串中的两个字符之间，其中一个是单词字符，另一个不是单词字符。

以下是每种情况的示例：

对于字符串foobar，第一种情况匹配
```
 foobar
^-----here
```
对于字符串foobar，第二种情况匹配
```
foobar
      ^--here
```

对于字符串foo bar，第三种情况将匹配

foo bar
   ^--here, because space is not a word character

什么符合单词字符取决于特定的正则表达式实现。但在所有情况下，字母 ([a-z]和[A-Z])、数字 ( [0-9]) 和都_被视为单词字符。

因此，您发布的示例正则表达式 ( \b[A-Z]+\b) 意味着找到两个单词边界之间且仅包含大写字母的最长字符串。通过例子可能更容易解释：

echo "FOOBAR" | egrep '\b[A-Z]+\b'   # Works
echo "FOO BAR" | egrep '\b[A-Z]+\b'  # Works
echo "aFOOBARb" | egrep '\b[A-Z]+\b' # Does not work, we want capitals only
echo "12345" | egrep '\b[A-Za]+\b'   # Does not work, no letters
echo "1FOOBAR2" | egrep '\b[A-Z]+\b' # Does not work, 1 and 2 are word chars
echo "_FOOBAR_" | egrep '\b[A-Z]+\b' # Does not work, _ is a word char
echo "#FOOBAR$" | egrep '\b[A-Z]+\b' # Works, # and $ are not word chars

Answer

如上所述这里，例如，它匹配之间字：

三种不同的位置都可以作为单词边界：

如果第一个字符是单词字符，则在字符串中的第一个字符之前。

在字符串中的最后一个字符之后，如果最后一个字符是单词字符。

字符串中的两个字符之间，其中一个是单词字符，另一个不是单词字符。