如何将“[}”或“[)”设置为gawk的FS?

如何将“[}”或“[)”设置为gawk的FS?

我正在使用 GNU Awk 5.0.1,我需要使用[}or [)as FS。我无法让它发挥作用。以下是我尝试过的。

root@u2004:~# echo test | awk -F '[}' '{printf}'
awk: fatal: invalid regexp: Unmatched [, [^, [:, [., or [=: /[}/
root@u2004:~# echo test | awk -F '[\}' '{printf}'
awk: warning: escape sequence `\}' treated as plain `}'
awk: fatal: invalid regexp: Unmatched [, [^, [:, [., or [=: /[}/
root@u2004:~# echo test | awk -F '[\\}' '{printf}'
awk: fatal: invalid regexp: Unmatched [, [^, [:, [., or [=: /[\}/
root@u2004:~# echo test | awk -F '[}}' '{printf}'
awk: fatal: invalid regexp: Unmatched [, [^, [:, [., or [=: /[}}/
root@u2004:~# echo test | awk -F "[}" '{printf}'
awk: fatal: invalid regexp: Unmatched [, [^, [:, [., or [=: /[}/
root@u2004:~# echo test | awk -F "[\}" '{printf}'
awk: warning: escape sequence `\}' treated as plain `}'
awk: fatal: invalid regexp: Unmatched [, [^, [:, [., or [=: /[}/
root@u2004:~# echo test | awk -F "[\\}" '{printf}'
awk: warning: escape sequence `\}' treated as plain `}'
awk: fatal: invalid regexp: Unmatched [, [^, [:, [., or [=: /[}/
root@u2004:~# echo test | awk -F "[}}" '{printf}'
awk: fatal: invalid regexp: Unmatched [, [^, [:, [., or [=: /[}}/
root@u2004:~#

我怎样才能做到这一点?

答案1

由于用作输入字段分隔符 ( ) 的任何多字符字符串FS都将被解释为正则表达式,因此该字符串必须是有效的正则表达式。

awk -F '\\[}' '{ print }'

不需要对 做任何特别的事情},但是必须将首字母[转义才能匹配文字左方括号。您需要两个反斜杠,因为使用单个反斜杠(如 中\[})会转义方括号并将分隔符表达式设置为[},这是一个无效的正则表达式。您也可以使用[[]in 代替\\[,它使用括号表达式匹配文字[,但不会节省键入时间,并且可能难以阅读。

我也冒昧地修复了代码。该printf语句采用格式字符串作为参数,然后输出一个或多个表达式。由于您没有提供格式字符串,因此会出现错误。

更短的变体是使用1(或任何非空、非零字符串)。这将充当测试这始终是正确的。真正的测试将触发默认操作,即打印当前记录(行)。

awk -F '\\[}' '1'

...尽管除了输出每行输入之外,这不会做任何令人兴奋的事情。对分隔符值的更有用的测试是

awk -F '\\[}' '{ print $1 }'

...打印每个输入记录的第一个字段,例如,{]ABC如果输入是{]ABC[}{]123[}.

答案2

你可以尝试这样的构建:

awk -v FS='\\[\}'  ' {printf}' input_file

它只需要“双重”转义[

作为记录,您可以使用结构的变体,例如:

 awk 'BEGIN{ FS="\\[\}"}  ' {printf}' input_file

或者

awk   ' {printf}' FS='\\[\}' input_file

像这样的构造也可以完成工作:

awk -F '[[]}' '{printf}' input_file

可选分隔符的“列表”仅包含[并且后面必须是}

PS Singleprintf在 中什么也不做awk。您应该添加一些参数,例如格式化字符串和要打印的变量。正如其他答案中提到的,如果您想打印整行,请使用'1'而不是'{printf}'

答案3

我发现括号表达式通常为这些 awk(!)ward 分隔符问题提供最简单的解决方案。根据 @cas 的评论:

$ echo 'one[}two' | awk -F '[[]}' '{print $2}'
two

熟悉括号表达式语法当然值得。尽管如果您不习惯它们,乍一看可能不太像,但我发现简单性和实用性通常比双转义(!)更容易编写和阅读。当然它们也可以用于其他实用程序,例如 grep 等。

相关内容