使用 awk 从文件中提取数据时出现问题

Question

您正在寻找以下-v选项awk：

   -v var=val
   --assign var=val
          Assign the value val to the variable var,  before  execution  of
          the  program  begins.  Such variable values are available to the
          BEGIN rule of an AWK program.

像这样：

cat ID.txt | 
    while read line; do awk -vline="$line" '$1 == l' test.txt >"$line".txt;done

更好的表达方式是（避免无用地使用 cat）：

while read line; do 
    awk -vline="$line" '$1 == l' test.txt >"$line".txt;
done < ID.txt

但是，这非常慢且效率低下。您正在对的每一行运行awk命令。为什么不直接读取它本身并打印匹配的行呢：test.txtID.txtID.txtawk

awk 'NR==FNR{a[$1]++; next} ($1 in a){print >> $1".txt"}' ID.txt test.txt

上述代码将的第一个字段保存ID.txt在数组中a。NR和FNR是特殊awk变量，表示“输入流的当前行”和“当前文件的当前行”。只有在读取第一个文件时，这两个变量才会相等。因此，NR==FNR{a[$1]++; next}只会在第一个文件的行上运行。第二部分将不会被执行，因为指示next跳到awk下一行。

第二部分，检查当前行的第一个字段（记住，这只在第二个文件上运行）是否存在于数组中a（这意味着它在ID.txt），如果存在，则将该行打印到名为“field1.txt”的文件中

Answer 1