正则表达式与预期数据不匹配

正则表达式与预期数据不匹配

我尝试通过以下awk命令根据过滤条件提取数据,但它不起作用。你能解决这个问题吗?

awk -v RS='' -v ORS='\n\n' '/func: peak*down*HIL/' filename

输入:

func: peak_rec_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_some_down_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_another_one_down_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_rec_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_another_one_down_head_joy_HIL
sub: xyz
value: adc
log:path
close:date

预期输出:

func: peak_some_down_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_another_one_down_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_another_one_down_head_joy_HIL
sub: xyz
value: adc
log:path
close:date

答案1

问题在于正则表达式。您需要将每个替换*.*以匹配子字符串之间的任意数量的任意字符。

awk -v RS='' -v ORS='\n\n' '/func: peak.*down.*HIL/' file

每个都*修改表达式前一部分的行为,允许其匹配零次或多次。该表达式peak*down将匹配peadownpeakdown、等中的任何一个peakkdownpeakkkdown

由于您的文件格式与使用的相同GNU 斜线,我个人会使用recsel而不是awk查询(或通常使用)您的数据:

recsel -e 'func ~ "peak.*down.*HIL"' file

使用了解数据格式的工具通常比通用文本处理工具更好(更容易、更强大、更容易维护)。

相关内容