匹配一个字符串并打印与另一个字符串匹配的同一块中的行

匹配一个字符串并打印与另一个字符串匹配的同一块中的行

我有一个包含 5000 多行的大文件,格式如下

下面的代码片段显示了该文件的两个块。

string name    : abcd

    used :metric
    test :ok

{


 fun: add

 fun: sub

 fun: mul

 fun: div

}   


string name    : degh

    used: non -metric
    test: good

{


 fun: per

 fun: div

 fun: add

 fun: mul


}   

我需要的是搜索string name(例如:),然后打印该块abcd之后的值fun :string name

我想要以下输出:

abcd    add
abcd    sub
abcd    mul
abcd    div
degh    per
degh    div
degh    add
degh    mul

解决这个问题的正确方法是什么?

答案1

解决该问题的方法之一是使用 perl:

$ perl -lane '$hold=$F[3] if $_ =~ "^string name.*";print "$hold $F[1]" if $F[0] eq "fun:"' bigfile.txt                                                                
abcd add
abcd sub
abcd mul
abcd div
degh per
degh div
degh add
degh mul

答案2

#!/bin/bash

RE_NAME='^ *string name *:' # regex for the 'name' line
RE_FUNSTART='^ *[{] *$'  # regex for the start of the 'fun' block
RE_FUNEND='^ *[}] *$'  # regex for end of 'fun' block
RE_FUN='^ *fun:'  # regex for 'fun' line

while read line; do
 if [[ $line =~ $RE_NAME ]]; then
     name="${line##*: }"
     echo
 elif [[ $line =~ $RE_FUNSTART ]]; then
     fun='1'
 elif [[ $line =~ $RE_FUNEND ]]; then
     fun=''
 elif [[ ($line =~ $RE_FUN) && (-n $fun) ]];  then   # match 'fun' lines only inside 'fun' block
     echo "$name    ${line##*: }"
 fi

done < your_big_file

Bash 处理大文件时可能会有点慢。如果它对你来说太慢,你可以将代码移植到 Perl 或 Python 等。

答案3

使用 awk 的另一种方法:

 awk '{ if ($1 == "string") name = $4; else if ($1 == "fun:") print name " " $2; }' your_file

假设“ string name”与“ :”之间有空格隔开,且“ fun”后面总是跟着“ :”,且没有空格。

相关内容