bash 是否支持参数扩展中的反向引用？

Question 1

ksh93并且内部zsh有反向引用（或更准确地说¹，对替换中捕获组的引用）支持${var/pattern/replacement}，而不是bash。

ksh93：

$ var='Blah: -> r1-ae0-2 / [123]'
$ printf '%s\n' "${var/*@(->*([[:space:]])+([^[:space:]]))*/\1}"
-> r1-ae0-2

zsh：

$ var='Blah: -> r1-ae0-2 / [123]'
$ set -o extendedglob
$ printf '%s\n' "${var/(#b)*(->[[:space:]]#[^[:space:]]##)*/$match[1]}"
-> r1-ae0-2

（mksh手册页还提到未来版本将支持${KSH_MATCH[1]}第一个捕获组。截至 2017 年 4 月 25 日尚未提供）。

但是，使用bash，您可以执行以下操作：

$ [[ $var =~ -\>[[:space:]]*[^[:space:]]+ ]] &&
  printf '%s\n' "${BASH_REMATCH[0]}"
-> r1-ae0-2

哪个更好，因为它检查是否首先找到该模式。

如果您的系统的正则表达式支持\s/ \S，您还可以执行以下操作：

re='->\s*\S+'
[[ $var =~ $re ]]

通过zsh，您可以通过以下方式获得 PCRE 的全部功能：

$ set -o rematchpcre
$ [[ $var =~ '->\s*\S+' ]] && printf '%s\n' $MATCH
-> r1-ae0-2

对于zsh -o extendedglob，另请参见：

$ printf '%s\n' ${(SM)var##-\>[[:space:]]#[^[:space:]]##}
-> r1-ae0-2

便携：

$ expr " $var" : '.*\(->[[:space:]]*[^[:space:]]\{1,\}\)'
-> r1-ae0-2

如果字符串中多次出现该模式，则所有这些解决方案的行为都会有所不同。然而，它们都不会像基于 GNU 的grep解决方案那样为您提供所有匹配项的换行符分隔列表。

为此，您需要手动进行循环。例如，与bash：

re='(->\s*\S+)(.*)'
while [[ $var =~ $re ]]; do
  printf '%s\n' "${BASH_REMATCH[1]}"
  var=${BASH_REMATCH[2]}
done

使用zsh，您可以采用这种技巧将所有匹配项存储在数组中：

set -o extendedglob
matches=() n=0
: ${var//(#m)->[[:space:]]#[^[:space:]]##/${matches[++n]::=$MATCH}}
printf '%s\n' $matches

¹反向引用更常见的是指定引用较早组匹配的模式。例如，$.$\1基本正则表达式匹配单个字符，后跟该同一字符（它匹配 on aa，而不是 on ab）。这是以相同模式\1对该捕获组的反向引用。$.$

ksh93确实支持其模式中的反向引用（例如ls -d -- @(?)\1将列出由两个相同字符组成的文件名），而不是其他 shell。标准 BRE 和 PCRE 支持反向引用，但不支持标准 ERE，尽管某些 ERE 实现支持将其作为扩展。bash's[[ foo =~ re ]]使用 ERE。

[[ aa =~ (.)\1 ]]

不会匹配，但是

re='(.)\1'; [[ aa =~ $re ]]

如果系统的 ERE 支持的话可以。

Answer