如何对同一个文件运行 awk 两次

Question 1

为时已晚，但为了后代，我想指出你可以这样做：

awk '
   {
       # do first pass stuff
   }
   
   END
   {
       while(getline < FILENAME)
       {    
           # do second pass stuff
       }
       close(FILENAME)
   }
' file

如果您想执行更多遍，可以close(FILENAME)在第一个 while 循环之后执行第二个循环。

Answer

为时已晚，但为了后代，我想指出你可以这样做：

awk '
   {
       # do first pass stuff
   }
   
   END
   {
       while(getline < FILENAME)
       {    
           # do second pass stuff
       }
       close(FILENAME)
   }
' file

如果您想执行更多遍，可以close(FILENAME)在第一个 while 循环之后执行第二个循环。

Question 2

我会使用两个数组：

awk -F, '{a[$0]=$2;if($3=="win")b[$2]++}END{for(i in a){if(b[a[i]])print i}}'

Answer

我会使用两个数组：

awk -F, '{a[$0]=$2;if($3=="win")b[$2]++}END{for(i in a){if(b[a[i]])print i}}'

Question 3

有没有更优雅的方法来做到这一点？

是的，当然有。只需在同一个文件上运行 Awk 两次（正如您在标题中所说）。

awk -F, '$3=="win"{won[$2]} FNR==NR{next} $2 in won' log.csv log.csv

Answer

有没有更优雅的方法来做到这一点？

是的，当然有。只需在同一个文件上运行 Awk 两次（正如您在标题中所说）。

awk -F, '$3=="win"{won[$2]} FNR==NR{next} $2 in won' log.csv log.csv

Question 4

我的填充方式grep比所以更快awk，如果你有的GNU grep话Perl 扩展你可以试试

fgrep -f <(grep -oP "[^,]*(?=,win)" log.csv) log.csv

没有的话perl.ext你就必须grep通过管道输出cut

fgrep -f <(grep win log.csv | cut -d, -f2) log.csv

或者使用sed（似乎比上面快一点grep| cut）

fgrep -f <(sed -n '/win/s/^[^,]*,\([^,]*\).*/\1/p' log.csv) log.csv

Answer

我的填充方式grep比所以更快awk，如果你有的GNU grep话Perl 扩展你可以试试

fgrep -f <(grep -oP "[^,]*(?=,win)" log.csv) log.csv

没有的话perl.ext你就必须grep通过管道输出cut

fgrep -f <(grep win log.csv | cut -d, -f2) log.csv

或者使用sed（似乎比上面快一点grep| cut）

fgrep -f <(sed -n '/win/s/^[^,]*,\([^,]*\).*/\1/p' log.csv) log.csv

如何对同一个文件运行 awk 两次

答案1

答案2

答案3

答案4

相关内容