似乎有点奇怪的是,&& 的逻辑运算符无法在 awk if 正则表达式模式中工作,这与 || 的逻辑运算符不同。可以正常工作!
注意:但是 && 的逻辑运算符可以在纯简单的 awk 正则表达式模式中工作,那为什么呢?
#
#
# cat /etc/passwd|awk '$0 ~/[Ss]ystem/ || /puls/ {print $0}'
dbus:x:81:81:System message bus:/:/sbin/nologin
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
#
#
#
# cat /etc/passwd|awk '$0 ~/[Ss]ystem/ && /puls/ {print $0}'
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
#
#
#
# cat /etc/passwd|awk '$0 ~/[Ss]ystem|puls/ {print $0}'
dbus:x:81:81:System message bus:/:/sbin/nologin
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
#
#
#
# cat /etc/passwd|awk '{k1[NR]=$0}END{for(i=1;i<=NR;i++)if(k1[i] ~/[Ss]ystem/ || /puls/){print k1[i]}}'
dbus:x:81:81:System message bus:/:/sbin/nologin
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
#
#
# cat /etc/passwd|awk '{k1[NR]=$0}END{for(i=1;i<=NR;i++)if(k1[i] ~/[Ss]ystem/ && /puls/){print k1[i]}}'
#
#
# cat /etc/passwd|awk '{k1[NR]=$0}END{for(i=1;i<=NR;i++)if(k1[i] ~/[Ss]ystem/ && /puls/){print k1[i]}}'
#
#
# cat /etc/passwd|awk '$0 ~/[Ss]ystem/ && /puls/ {print $0}'
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
#
#
现在我做了一些修改之后,最新的情况可能会变得比以前更加奇怪!
为什么下面带有数组变量和逻辑运算符 && 的相同正则表达式模式可以工作?
注意:这应该解释一些 if 正则表达式模式中的 && 问题至少与数组变量本身无关。
#
#
# cat /etc/passwd|awk '{k0[NR]=$0;if(k0[NR] ~/[Ss]ystem/ && /puls/){print k0[NR]}}'
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
#
#
# cat /etc/passwd|awk '{k0[NR]=$0;if(k0[NR] ~/[Ss]ystem/ || /puls/){print k0[NR]}}'
dbus:x:81:81:System message bus:/:/sbin/nologin
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
#
#
# cat /etc/passwd|awk '{k0[NR]=$0;if(k0[NR] ~/[Ss]ystem/ && /puls/){print k0[NR]}}'
pulse:x:497:495:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
#
#
答案1
在第一部分中
$0 ~/[Ss]ystem/ && /puls/
是隐含的
$0 ~/[Ss]ystem/ && $0 ~ /puls/
所以
if(k1[i] ~/[Ss]ystem/ && /puls/)
应该写成
if(k1[i] ~/[Ss]ystem/ && k1[i] ~ /puls/)
- 在前一种情况下,
/pusl/
很可能(*) 与 的最后一行匹配/etc/passwd
。 - 另请参阅
man awk
但~
(和!~
) 优先于&&
(*) 已确认,如果我将 PulseAudio 行移至最后一行,则匹配已完成。
答案2
您假设了错误的运算符关联,也可能假设了它们的含义。对测试用例进行编号:
$0 ~/[Ss]ystem/
检查“$0 是否匹配 /RE/”。该|| /puls/
条件甚至没有经过测试:它是“短路”的,因为整体条件已知为真。检查
&&
两个条件是否都为真,并且仅匹配一行。组合的 RE(带有 的两种替代情况
|
)匹配两行。这与包含 的存储行相匹配
System
。这不匹配任何内容。它测试数组中存储的行,但“/puls/”测试 $0 中的值后你已经跑出了文件的末尾——它不引用 k1[i]。 $0 仍将包含文件的最后一行,我推测完整的输入文件末尾没有这样的行。要求
&&
两个条件都为真,因此没有行匹配。是 (5) 的重复。
是 (2) 的重复。
答案3
这是对您最初问题的“最新情况”的解构,以简化问题。
cat /etc/passwd|awk '{k0[NR]=$0;if(k0[NR] ~/[Ss]ystem/ && /puls/){print k0[NR]}}'
cat 不会向代码添加任何内容,因为 awk 本身可以读取文件。 (谷歌 UUOC 了解更多。)
将输入行存储在数组中,然后在同一语句中测试值,不会添加任何内容(因为没有 END 块)。所以我们可以简化为:
awk '{if($0 ~/[Ss]ystem/ && /puls/){print $0}}' /etc/passwd
使用~
模式匹配与普通 RE 相同,因此简化为:
awk '{if(/[Ss]ystem/ && /puls/){print $0}}' /etc/passwd
使用 anif
与大括号外的模式相同,因此:
awk '/[Ss]ystem/ && /puls/ {print $0}' /etc/passwd
print $0
与 相同print
,并且{ print }
由于操作是默认操作,因此:
awk '/[Ss]ystem/ && /puls/' /etc/passwd
您最初的断言“&&
无法工作但||
工作正常”是错误的。
这读作“如果模式 A和模式 B 出现在该输入行中”:
awk '/[Ss]ystem/ && /puls/' /etc/passwd
这读作“如果模式 A或者模式 B 出现在该输入行中”:
awk '/[Ss]ystem/ || /puls/' /etc/passwd