如何使用AWK查询加载了mapfile的文件

Question

只需一个awk这样的命令：

awk -v reflog=OUT.LOG '
    BEGIN{
      FS=OFS=",";
      while((getline <reflog) > 0) refs[$3]=$1;
      close(reflog)
    }{
      print $3,$1,refs[$3] ? refs[$3] : "not found"
    }' IN.LOG

或者使用join专门为这样的用例而设计的：

join -t, -j 3 -o 0,1.1,2.1 -a 1 -e "not found" \
  <(sort -t, -k3 IN.LOG) <(sort -t, -k3 OUT.LOG) \
  | sort -t, -k2

注意，join需要对输入文件进行排序（按“连接列”）。这就是为什么我们先按引用列对两个日志文件进行排序，然后再按日期对输出进行排序。

两种解决方案的行为不同关于 OUT.LOG 中的非唯一引用。awk会忽略 OUT.LOG 中的重复引用（最后一个获胜），但join会打印所有匹配项。此外，如果您添加-a 2到命令中join，它会打印全部不可配对的线路。

Answer 1

只需一个awk这样的命令：

awk -v reflog=OUT.LOG '
    BEGIN{
      FS=OFS=",";
      while((getline <reflog) > 0) refs[$3]=$1;
      close(reflog)
    }{
      print $3,$1,refs[$3] ? refs[$3] : "not found"
    }' IN.LOG

或者使用join专门为这样的用例而设计的：

join -t, -j 3 -o 0,1.1,2.1 -a 1 -e "not found" \
  <(sort -t, -k3 IN.LOG) <(sort -t, -k3 OUT.LOG) \
  | sort -t, -k2

注意，join需要对输入文件进行排序（按“连接列”）。这就是为什么我们先按引用列对两个日志文件进行排序，然后再按日期对输出进行排序。

两种解决方案的行为不同关于 OUT.LOG 中的非唯一引用。awk会忽略 OUT.LOG 中的重复引用（最后一个获胜），但join会打印所有匹配项。此外，如果您添加-a 2到命令中join，它会打印全部不可配对的线路。

如何使用AWK查询加载了mapfile的文件

答案1

相关内容