使用 awk 或 grep 捕获组

Question

shellbash本身提供了一种根据方便需要对捕获的组进行正则表达式匹配处理的方法。

=~双括号内的运算符测试表达式，匹配[[字符串位于运算符左侧，正则表达式作为右侧操作数。

if [[ "$str" =~ $re ]]; then

如果表达式与字符串匹配，则字符串的匹配部分存储在数组中BASH_REMATCH，可以循环访问各个捕获的组。退出状态是0正则表达式是否匹配、1不匹配以及2表达式是否无效。

就您的示例而言，假设您将输入行存储在数组中，并且单词blah和hello是固定模式

#!/usr/bin/env bash

exampleStr=('blah12687hello=123' 'nothingthatmatches' 'blah3211hello=123456' 'blah15butnottheotherpattern')

re='blah([[:digit:]]+)hello=([[:digit:]]+)'

for str in "${exampleStr[@]}"; do
    if [[ "$str" =~ $re ]]; then
       for group in "${BASH_REMATCH[@]}"; do
           printf "%s\n" "$group"
       done
    else
       printf "No match \n"
    fi
done

正如您在上面的代码中看到的，一旦我们将正则表达式匹配为 true，我们就可以循环数组BASH_REMATCH以打印每个捕获的组。整体脚本输出类似于

blah12687hello=123     # Value of BASH_REMATCH[0]
12687                  # Value of BASH_REMATCH[1]
123                    # Value of BASH_REMATCH[2]
Regex not matches.
blah3211hello=123456
3211
123456
Regex not matches.

正如您所看到的，BASH_REMATCH[0]始终包含正则表达式成功匹配的字符串部分，并且可以从索引开始访问各个捕获的组1。您可以编写自定义逻辑来处理每个捕获的组，这正是您最初打算执行的操作。

如果您有兴趣读取文件输入，只需while在要处理的文件上使用带有输入重定向的循环

while IFS= read -r line; do
    if [[ "$line" =~ $re ]]; then
       for group in "${BASH_REMATCH[@]}"; do
           printf "%s\n" "$group"
       done
    else
       printf "No match \n"
    fi
done < inputFile.txt

Answer 1