从 awk 中的 FILENAME 中提取值并将其用作新字段

Question

由于它是每个文件的属性，因此您应该JOBID在处理任何文件的第一行时进行计算，IE什么时候FNR是1：

awk -F";" 'BEGIN { OFS = FS }
FNR == 1 { JOBID=substr(FILENAME, match(FILENAME, "[0-9]{8}"), 8); print }
FNR > 1 { print $0, JOBID }' \
Event_42417555_2018-05-23_16\:45\:28-log.txt | head

有多种方法可以提取正则表达式的匹配项；我通常会match进入一个数组：

awk -F";" 'BEGIN { OFS = FS }
FNR == 1 { match(FILENAME, "([0-9]{8})", a); JOBID = a[1]; print }
FNR > 1 { print $0, JOBID }' \
Event_42417555_2018-05-23_16\:45\:28-log.txt | head

最好有一些错误处理。这用于match查找文本匹配[0-9]{8}，并将任何匹配值提取到数组中a（match查找组，因此添加括号）。

另一种适用于任何 AWK 实现的方法是用下划线分割文件名：

awk -F";" 'BEGIN { OFS = FS }
FNR == 1 { split(FILENAME, a, "_"); JOBID = a[2]; print }
FNR > 1 { print $0, JOBID }' \
Event_42417555_2018-05-23_16\:45\:28-log.txt | head

您的版本中出现双倍输出是因为JOBID=substr(FILENAME ,match(FILENAME,"[0-9]{8}"),8)它是一个完整的表达式，其权重与 AWK 程序中的任何其他表达式相同，并且具有隐式块（IE print）；它总是匹配，因为JOBID总是非空并且不是等于零的数值，所以它的块总是被处理。

Answer 1