&& 的逻辑运算符不能在 awk if 正则表达式模式中工作

&& 的逻辑运算符不能在 awk if 正则表达式模式中工作

似乎有点奇怪的是,&& 的逻辑运算符无法在 awk if 正则表达式模式中工作,这与 || 的逻辑运算符不同。可以正常工作!
注意:但是 && 的逻辑运算符可以在纯简单的 awk 正则表达式模式中工作,那为什么呢?

# 
# 
# cat /etc/passwd|awk '$0 ~/[Ss]ystem/ || /puls/ {print $0}'
dbus:x:81:81:System message bus:/:/sbin/nologin
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
# 
# 
# 
# cat /etc/passwd|awk '$0 ~/[Ss]ystem/ &&  /puls/ {print $0}'
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
# 
# 
# 
# cat /etc/passwd|awk '$0 ~/[Ss]ystem|puls/ {print $0}'
dbus:x:81:81:System message bus:/:/sbin/nologin
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
# 
# 
# 
# cat /etc/passwd|awk '{k1[NR]=$0}END{for(i=1;i<=NR;i++)if(k1[i] ~/[Ss]ystem/ || /puls/){print k1[i]}}'
dbus:x:81:81:System message bus:/:/sbin/nologin
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
# 
# 
# cat /etc/passwd|awk '{k1[NR]=$0}END{for(i=1;i<=NR;i++)if(k1[i] ~/[Ss]ystem/ && /puls/){print k1[i]}}'
# 
# 
# cat /etc/passwd|awk '{k1[NR]=$0}END{for(i=1;i<=NR;i++)if(k1[i] ~/[Ss]ystem/ && /puls/){print k1[i]}}'
# 
# 
# cat /etc/passwd|awk '$0 ~/[Ss]ystem/ &&  /puls/ {print $0}'
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
# 
# 


现在我做了一些修改之后,最新的情况可能会变得比以前更加奇怪!
为什么下面带有数组变量和逻辑运算符 && 的相同正则表达式模式可以工作?
注意:这应该解释一些 if 正则表达式模式中的 && 问题至少与数组变量本身无关。
# 
# 
# cat /etc/passwd|awk '{k0[NR]=$0;if(k0[NR] ~/[Ss]ystem/ && /puls/){print k0[NR]}}'
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
# 
# 
# cat /etc/passwd|awk '{k0[NR]=$0;if(k0[NR] ~/[Ss]ystem/ || /puls/){print k0[NR]}}'
dbus:x:81:81:System message bus:/:/sbin/nologin
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
# 
# 
# cat /etc/passwd|awk '{k0[NR]=$0;if(k0[NR] ~/[Ss]ystem/ && /puls/){print k0[NR]}}'
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
# 
# 

答案1

在第一部分中

$0 ~/[Ss]ystem/ &&  /puls/

是隐含的

$0 ~/[Ss]ystem/ && $0 ~ /puls/

所以

if(k1[i] ~/[Ss]ystem/ && /puls/)

应该写成

if(k1[i] ~/[Ss]ystem/ && k1[i] ~ /puls/)
  • 在前一种情况下,/pusl/可能(*) 与 的最后一行匹配/etc/passwd
  • 另请参阅man awk~(和!~) 优先于&&

(*) 已确认,如果我将 PulseAudio 行移至最后一行,则匹配已完成。

答案2

您假设了错误的运算符关联,也可能假设了它们的含义。对测试用例进行编号:

  1. $0 ~/[Ss]ystem/检查“$0 是否匹配 /RE/”。该|| /puls/条件甚至没有经过测试:它是“短路”的,因为整体条件已知为真。

  2. 检查&&两个条件是否都为真,并且仅匹配一行。

  3. 组合的 RE(带有 的两种替代情况|)匹配两行。

  4. 这与包含 的存储行相匹配System

  5. 这不匹配任何内容。它测试数组中存储的行,但“/puls/”测试 $0 中的值你已经跑出了文件的末尾——它不引用 k1[i]。 $0 仍将包含文件的最后一行,我推测完整的输入文件末尾没有这样的行。要求&&两个条件都为真,因此没有行匹配。

  6. 是 (5) 的重复。

  7. 是 (2) 的重复。

答案3

这是对您最初问题的“最新情况”的解构,以简化问题。

cat /etc/passwd|awk '{k0[NR]=$0;if(k0[NR] ~/[Ss]ystem/ && /puls/){print k0[NR]}}'

cat 不会向代码添加任何内容,因为 awk 本身可以读取文件。 (谷歌 UUOC 了解更多。)

将输入行存储在数组中,然后在同一语句中测试值,不会添加任何内容(因为没有 END 块)。所以我们可以简化为:

awk '{if($0 ~/[Ss]ystem/ && /puls/){print $0}}' /etc/passwd

使用~模式匹配与普通 RE 相同,因此简化为:

awk '{if(/[Ss]ystem/ && /puls/){print $0}}' /etc/passwd

使用 anif与大括号外的模式相同,因此:

awk '/[Ss]ystem/ && /puls/ {print $0}' /etc/passwd

print $0与 相同print,并且{ print }由于操作是默认操作,因此:

awk '/[Ss]ystem/ && /puls/' /etc/passwd

您最初的断言“&&无法工作但||工作正常”是错误的。

这读作“如果模式 A模式 B 出现在该输入行中”:

awk '/[Ss]ystem/ && /puls/' /etc/passwd

这读作“如果模式 A或者模式 B 出现在该输入行中”:

awk '/[Ss]ystem/ || /puls/' /etc/passwd

相关内容