awk 对转义序列发出警告

awk 对转义序列发出警告

我正在awk使用字符类 ere 发出命令。

cere='^[[:space:]]*([#;!]+|@c|\/\/)[[:space:]]*'

这会产生 awk 警告。

awk: warning: escape sequence `\/' treated as plain `/'

这是需要担心或解决的事情吗?

这是我用于匹配区域的 awk 调用

charcl_ere='^[[:space:]]*([#;!]+|@c|\/\/)[[:space:]]*'

begrec="${charcl_ere}${selec}[[:space:]]*$"
endrec="${charcl_ere}# end of ${fieldval}[[:space:]]*$"

awk -v ccls="$charcl_ere" -v begrsc="$begrec" -v endrsc="$endrec" \
    '$0 ~ begrsc { insc=1; next }
     $0 ~ endrsc { insc=0; print "" }
     insc { sub(ccls,""); print }' "$efile"

答案1

/正则表达式中的正斜杠字符并不特殊。它需要在 awk 中进行转义正则表达式常量原因与需要在 sed 表达式(如s/pattern/replacement/1 )中进行转义的原因相同;也就是说,因为/用于划界正则表达式。因此

$ printf '%s\n' 'foo//bar' 'foo\\baz'
foo//bar
foo\\baz

然后

$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk '$0 ~ /o\/\/b/'
foo//bar

然而,当你将正则表达式作为字符串传递给 awk 时,它就变成了动态正则表达式. 因为它是字符串表达式而不是正则表达式常量,没有分隔符冲突,并且/毫无疑问是文字字符:

$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk -v re='o//b' '$0 ~ re'
foo//bar

是引起你所询问的警告的情况,即如果你(不必要地)转义斜线,awk 会提醒你字符串表达式中\/是相同的/

$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk -v re='o\/\/b' '$0 ~ re'
awk: warning: escape sequence `\/' treated as plain `/'
foo//bar

虽然你没有问反斜杠,但可能也值得一提。他们正则表达式中的特殊字符,需要进行转义才能使它们在正则表达式常量中成为文字:

$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk '$0 ~ /o\\\\b/'
foo\\baz

但是这一次,由于转义与分隔符无关,因此在使用动态正则表达式时仍需要转义。更令人困惑的是,\在字符串表达式中也是特殊的(\t例如,表示 TAB 字符)。因此,在使用动态正则表达式时,每个都\需要转义两次- 一次使其成为字符串文字,再次使其成为正则表达式文字:

$ printf '%s\n' 'foo//bar' 'foo\\baz' | awk -v re='o\\\\\\\\b' '$0 ~ re'
foo\\baz

最后,如果你使用的是最新版本的 GNU awk(又名 gawk),那么可以使用强类型正则表达式常量,其中你即使您正在从 shell 传递字符串,也需要转义正斜杠:

$ printf '%s\n' 'foo//bar' 'foo\\baz' | gawk -v re='@/o\/\/b/' '$0 ~ re'
foo//bar

1 sed 允许您选择不同的分隔符,而不是转义默认分隔符,例如s:o//b::\%o//%;据我所知,awk 不允许。

相关内容