我尝试通过以下awk
命令根据过滤条件提取数据,但它不起作用。你能解决这个问题吗?
awk -v RS='' -v ORS='\n\n' '/func: peak*down*HIL/' filename
输入:
func: peak_rec_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_some_down_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_another_one_down_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_rec_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_another_one_down_head_joy_HIL
sub: xyz
value: adc
log:path
close:date
预期输出:
func: peak_some_down_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_another_one_down_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_another_one_down_head_joy_HIL
sub: xyz
value: adc
log:path
close:date
答案1
问题在于正则表达式。您需要将每个替换*
为.*
以匹配子字符串之间的任意数量的任意字符。
awk -v RS='' -v ORS='\n\n' '/func: peak.*down.*HIL/' file
每个都*
修改表达式前一部分的行为,允许其匹配零次或多次。该表达式peak*down
将匹配peadown
、peakdown
、等中的任何一个peakkdown
。peakkkdown
由于您的文件格式与使用的相同GNU 斜线,我个人会使用recsel
而不是awk
查询(或通常使用)您的数据:
recsel -e 'func ~ "peak.*down.*HIL"' file
使用了解数据格式的工具通常比通用文本处理工具更好(更容易、更强大、更容易维护)。