我有一个充满大量数据的文本文件。我需要提取包含特定字符串的行。我通过 awk 使用以下命令完成了此操作:
awk '/pattern1|pattern2|pattern3/ {print;}' infile
然后我需要在第三行之后添加一个新行(\n)。所以它需要看起来像这样
pattern1
pattern2
pattern3
<new line>
pattern1...
我能够通过将第一个命令传递到另一个 awk 语句中来完成此任务
awk -F '\n' '/pattern1|pattern2|pattern3/ { print; }' infile | awk '{ if ((NR % 3) == 1) printf("\n"); print; }'
我认为必须有一种更有效的方法来做到这一点,所以我开始寻找如何将这两个命令组合在一起。我尝试了以下方法:
awk '/pattern1|pattern2|pattern3/ { if ((NR % 3) ==1 ) printf("\n"); print; }'
我认为这可行,但输出是完全不可预测的,有时有 5 行组合在一起,每组 2 行,但没有 3 行。
我想可能存在分隔符问题,所以我尝试使用 -F 选项并设置 IFS,但都没有改变输出。
我认为我在尝试将模式匹配与 if 语句结合起来时做了一些愚蠢的事情,但我无法弄清楚该组合。
我想要在单个 awk 命令中完成的事情是可能的吗?如果是这样,我哪里出错了?
答案1
您尝试的解决方案的问题在于 awkNR
是对输入记录,而您想根据记录数插入换行符输出记录。
我不认为 awk 本身会保留这样的计数,但你可以做类似的事情
awk '/pattern1|pattern2|pattern3/ {print; if (++onr%3 == 0) print ""; }' infile
其中我们定义了一个新变量onr
(对于输出记录数- 变量名称是任意的)并在每次匹配/打印所需文本时递增它,然后检查是否那能被 3 整除,如果是则打印换行符。
答案2
我理解正确吗,你正在尝试发明
awk '/pattern1|pattern2/ {print $1;} /pattern3/ {print $1 "\n"}' infile