我正在awk
使用字符类 ere 发出命令。
cere='^[[:space:]]*([#;!]+|@c|\/\/)[[:space:]]*'
这会产生 awk 警告。
awk: warning: escape sequence `\/' treated as plain `/'
这是需要担心或解决的事情吗?
这是我用于匹配区域的 awk 调用
charcl_ere='^[[:space:]]*([#;!]+|@c|\/\/)[[:space:]]*'
begrec="${charcl_ere}${selec}[[:space:]]*$"
endrec="${charcl_ere}# end of ${fieldval}[[:space:]]*$"
awk -v ccls="$charcl_ere" -v begrsc="$begrec" -v endrsc="$endrec" \
'$0 ~ begrsc { insc=1; next }
$0 ~ endrsc { insc=0; print "" }
insc { sub(ccls,""); print }' "$efile"
答案1
/
正则表达式中的正斜杠字符并不特殊。它需要在 awk 中进行转义正则表达式常量原因与需要在 sed 表达式(如s/pattern/replacement/
1 )中进行转义的原因相同;也就是说,因为/
用于划界正则表达式。因此
$ printf '%s\n' 'foo//bar' 'foo\\baz'
foo//bar
foo\\baz
然后
$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk '$0 ~ /o\/\/b/'
foo//bar
然而,当你将正则表达式作为字符串传递给 awk 时,它就变成了动态正则表达式. 因为它是字符串表达式而不是正则表达式常量,没有分隔符冲突,并且/
毫无疑问是文字字符:
$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk -v re='o//b' '$0 ~ re'
foo//bar
这是引起你所询问的警告的情况,即如果你(不必要地)转义斜线,awk 会提醒你字符串表达式中,\/
是相同的/
:
$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk -v re='o\/\/b' '$0 ~ re'
awk: warning: escape sequence `\/' treated as plain `/'
foo//bar
虽然你没有问反斜杠,但可能也值得一提。他们是正则表达式中的特殊字符,需要进行转义才能使它们在正则表达式常量中成为文字:
$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk '$0 ~ /o\\\\b/'
foo\\baz
但是这一次,由于转义与分隔符无关,因此在使用动态正则表达式时仍需要转义。更令人困惑的是,\
在字符串表达式中也是特殊的(\t
例如,表示 TAB 字符)。因此,在使用动态正则表达式时,每个都\
需要转义两次- 一次使其成为字符串文字,再次使其成为正则表达式文字:
$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk -v re='o\\\\\\\\b' '$0 ~ re'
foo\\baz
最后,如果你使用的是最新版本的 GNU awk(又名 gawk),那么可以使用强类型正则表达式常量,其中你会即使您正在从 shell 传递字符串,也需要转义正斜杠:
$ printf '%s\n' 'foo//bar' 'foo\\baz' | gawk -v re='@/o\/\/b/' '$0 ~ re'
foo//bar
1 sed 允许您选择不同的分隔符,而不是转义默认分隔符,例如s:o//b::
或\%o//%
;据我所知,awk 不允许。