AWK：如何使用正则表达式比较两个变量

Question 1

您可以将正则表达式放在字符串中 a 的右侧~，它不必是一个/.../构造。（差异可能与在运行时或编译时解析 RE 有关，但我不确定。）请记住，在中awk，美元符号并不意味着像 shell 或 Perl 中那样的变量扩展，因此您需要连接$3到字符串的其余部分：

第一个匹配，第二个不匹配：

$ echo 'foo fo+' |awk '$1 ~ "^" $2'
foo fo+
$ echo 'foo o+' |awk '$1 ~ "^" $2'
$

/^$2/被视为$2其中包含文字的正则表达式，并且$是行尾锚点。由于 EOL 之后您将无法拥有任何内容，因此 RE 永远无法匹配。

Answer

您可以将正则表达式放在字符串中 a 的右侧~，它不必是一个/.../构造。（差异可能与在运行时或编译时解析 RE 有关，但我不确定。）请记住，在中awk，美元符号并不意味着像 shell 或 Perl 中那样的变量扩展，因此您需要连接$3到字符串的其余部分：

第一个匹配，第二个不匹配：

$ echo 'foo fo+' |awk '$1 ~ "^" $2'
foo fo+
$ echo 'foo o+' |awk '$1 ~ "^" $2'
$

/^$2/被视为$2其中包含文字的正则表达式，并且$是行尾锚点。由于 EOL 之后您将无法拥有任何内容，因此 RE 永远无法匹配。

Question 2

/^$3/是一个正则表达式保证永远不会匹配因为它匹配3记录末尾之后的记录（$正则表达式锚运算符匹配主题末尾，不要与$ awk用于按数字取消引用字段的运算符混淆）。

要测试第三个字段是否出现在第四个字段的开头，可以使用进行正则表达式匹配match()，这将返回匹配的起始位置（如果未找到匹配，则返回 -1）：

awk -F ':' 'match($4, $3) == 1 { ..."GOOD"... ; next } { ..."BAD"... }'

或者，对于字符串比较，

awk -F ':' 'substr($4, 1, length($3)) == $3 { ..."GOOD"... ; next } { ..."BAD"... }'

Answer

/^$3/是一个正则表达式保证永远不会匹配因为它匹配3记录末尾之后的记录（$正则表达式锚运算符匹配主题末尾，不要与$ awk用于按数字取消引用字段的运算符混淆）。

要测试第三个字段是否出现在第四个字段的开头，可以使用进行正则表达式匹配match()，这将返回匹配的起始位置（如果未找到匹配，则返回 -1）：

awk -F ':' 'match($4, $3) == 1 { ..."GOOD"... ; next } { ..."BAD"... }'

或者，对于字符串比较，

awk -F ':' 'substr($4, 1, length($3)) == $3 { ..."GOOD"... ; next } { ..."BAD"... }'

相关内容