如何在匹配表达式中编写正则表达式文字?

如何在匹配表达式中编写正则表达式文字?

这个问题是关于编写正则表达式的正确方法文字在 bash 下的匹配表达式中。

在 zsh 中,下面的匹配成功,正如我所料:

% [[ ' 123 ' =~ '^ [0-9]+ $' ]]; echo $?
0

在 bash 中则不然:

$ [[ ' 123 ' =~ '^ [0-9]+ $' ]]; echo $?
1

我知道这场比赛在 bash 中成功

$ ( regexp='^ [0-9]+ $'; [[ ' 123 ' =~ $regexp ]]; echo $? )
0

...但它需要将正则表达式分配给中间变量。


我的问题是:如何编写任意正则表达式文字在 bash 下的匹配表达式中?

答案1

最好按照 Bash 参考手册的建议将其放入变量中3.2.4.2 条件构造:

将正则表达式存储在 shell 变量中通常是避免引用 shell 特有字符时出现问题的有用方法。有时很难在不使用引号的情况下按字面指定正则表达式,或者在注意 shell 的引号删除的同时跟踪正则表达式使用的引号。使用 shell 变量来存储模式可以减少这些问题。

但是,为了将其直接写入 bash 扩展测试中,您需要删除引号并转义空格:

$ [[ ' 123 ' =~ ^\ [0-9]+\ $ ]]; echo $?
0

答案2

在 bash 中,规范的答案是:使用变量

$ reg='^ [0-9]+ $'
$ [[ ' 123 ' =~ $reg ]]; echo $?

这适用于空格、反斜杠和许多其他东西:

$ reg='^ 12\3 $'
$ [[ ' 12\3 ' =~ $reg ]]; echo $?
0

如果你想把它写成文字你需要玩(小心)并引用。
您需要引用部分需要是字面意思,并保留应解释为正则表达式的部分不加引号。空间需要引用。这里使用反斜杠:

$ [[ ' 123 ' =~ ^\ [0-9]+\ $ ]]; echo $?
0

这里使用双引号:

$ [[ ' 123 ' =~ ^" "[0-9]+" "$ ]]; echo $?

但是“引用”会因为反斜杠之类的东西而变得非常混乱:

$ [[ ' 12\3 ' =~ ^" "[0-9]+"\\"[0-9]+" "$ ]]; echo $?
0

更简单、更安全:

$ reg='^ [0-9]+\\[0-9]+ $'
$ [[ ' 12\3 ' =~ $reg ]]; echo $?
0

而且,不,您不需要子 shell 来执行此操作(问题中的括号)。

$ reg='^ [0-9]+\\[0-9]+ $'; [[ ' 12\3 ' =~ $reg ]]; echo $?

是的,这可能看起来很烦人。是的,您提供的命令恰好可以在 zsh 中运行:

$ [[ ' 123 ' =~ '^ [0-9]+ $' ]]; echo $?
0

但引用总是一个问题(在任何 shell 中),反斜杠会发生什么?:

% [[ ' 12\3 ' =~ ' 12\3 ' ]]; echo $?
zsh: failed to compile regex: Invalid back reference
1


% [[ ' 12\3 ' =~ '^ [0-9]+\\3 $' ]]; echo $?
0

加倍!不完全是:文字

相关内容