正则解释：[a-zA-Z0-9][a-zA-Z0-9] 与 [a-zA-Z0-9] 之间的区别，其中 * 与 +

Question

sed 使用的 POSIX“基本”正则表达式语言没有+运算符，因此[a-zA-Z0-9]+只匹配一个字母数字字符 - 后跟一个文字加号。

它确实有\{x,y\}运算符来接受指定数量的匹配，例如：

$ echo 'abc def' | sed 's/\([a-zA-Z0-9]\{2,\}\) \([a-zA-Z0-9]\{2,\}\)/\2 \1/'
def abc

用于sed -E启用“扩展”正则表达式模式，其中+是特殊字符。这也会改变括号的工作方式 - 在扩展模式下，空括号( )用于捕获组，同样空括号{ }用于匹配数，与基本模式相反。

$ echo 'abc def' | sed -E 's/([a-zA-Z0-9][a-zA-Z0-9]+) ([a-zA-Z0-9][a-zA-Z0-9]+)/\2 \1/'
def abc

$ echo 'abc def' | sed -E 's/([a-zA-Z0-9]{2,}) ([a-zA-Z0-9]{2,})/\2 \1/'
def abc

GNU sed/grep 也允许您在基本模式下使用\+，但这无法移植到其他操作系统。请参阅info "(sed)BRE syntax"和info "(sed)ERE syntax"（或man 7 regex）以比较这两种模式。

Answer 1

sed 使用的 POSIX“基本”正则表达式语言没有+运算符，因此[a-zA-Z0-9]+只匹配一个字母数字字符 - 后跟一个文字加号。

它确实有\{x,y\}运算符来接受指定数量的匹配，例如：

$ echo 'abc def' | sed 's/\([a-zA-Z0-9]\{2,\}\) \([a-zA-Z0-9]\{2,\}\)/\2 \1/'
def abc

用于sed -E启用“扩展”正则表达式模式，其中+是特殊字符。这也会改变括号的工作方式 - 在扩展模式下，空括号( )用于捕获组，同样空括号{ }用于匹配数，与基本模式相反。

$ echo 'abc def' | sed -E 's/([a-zA-Z0-9][a-zA-Z0-9]+) ([a-zA-Z0-9][a-zA-Z0-9]+)/\2 \1/'
def abc

$ echo 'abc def' | sed -E 's/([a-zA-Z0-9]{2,}) ([a-zA-Z0-9]{2,})/\2 \1/'
def abc

GNU sed/grep 也允许您在基本模式下使用\+，但这无法移植到其他操作系统。请参阅info "(sed)BRE syntax"和info "(sed)ERE syntax"（或man 7 regex）以比较这两种模式。

正则解释：[a-zA-Z0-9][a-zA-Z0-9] 与 [a-zA-Z0-9] 之间的区别，其中 * 与 +

答案1

相关内容