如何获取同一行的总行数和唯一计数

Question 1

天真的解决方案只是计算每次出现的次数并跟踪以查看我们以前是否见过它。

所以：

awk -F, '{ t[$1]++; seen[$0]++; if (seen[$0] == 1) { u[$1]++ } }
         END { for (a in t) { print a "," t[a] "," u[a] } }'

第一行将跟踪该日期在中出现的总次数t。它将跟踪我们在中看到每一行的次数seen，如果这是我们第一次看到它，那么我们就知道它是唯一的并将其计入中u。

第二行将迭代结果并将其打印出来。

Answer

天真的解决方案只是计算每次出现的次数并跟踪以查看我们以前是否见过它。

所以：

awk -F, '{ t[$1]++; seen[$0]++; if (seen[$0] == 1) { u[$1]++ } }
         END { for (a in t) { print a "," t[a] "," u[a] } }'

第一行将跟踪该日期在中出现的总次数t。它将跟踪我们在中看到每一行的次数seen，如果这是我们第一次看到它，那么我们就知道它是唯一的并将其计入中u。

第二行将迭代结果并将其打印出来。

Question 2

如果您可以求助于 GNUawk

awk -F, '{a[$1]++; b[$1][$2]}; 
    END{for (k in a) printf "%s,%d,%d\n", k, a[k], length(b[k])}' test.csv

Answer

如果您可以求助于 GNUawk

awk -F, '{a[$1]++; b[$1][$2]}; 
    END{for (k in a) printf "%s,%d,%d\n", k, a[k], length(b[k])}' test.csv

相关内容