如何按名字排序？

Question

您应该始终sort在使用uniq命令之前使用。工作方式uniq是，它仅在重复项逐一排列时才计算重复项，如果同一行在某些不同行之后有几行，则该行不会被计入先前的重复项。

您应该始终使用sort和管道 touniq -c来获取相同行的准确计数。

另外，由于第一列将是一些计数，sort -n如果您希望按出现次数对它们进行排序，则应该使用它们。

您还可以删除第一只猫并直接对文件而不是输出执行 awk cat。

你应该使用这样的东西：

gawk '$9=="404"' log.txt | gawk '{print $7 , $9}' |  sort | uniq -c | sort -n

sort -k如果您不想按计数排序，也可以使用按第二列排序。

gawk '$9=="404"' log.txt | gawk '{print $7 , $9}' |  sort | uniq -c | sort -k 2

如果您不需要计算行数，则可以使用 sort -u 来获取唯一行，并且可以将两个 awk 管道合并为一个。

gawk '$9=="404" {print $7 , $9}' log.txt | sort -u

如果您想按出现次数排序并在一个命令中计算所有 404，您需要在 awk 中执行以下操作：

gawk '{PROCINFO["sorted_in"] = "@val_num_asc"} $9=="404" {count_url[$7]++} {count_404[$9]++} END {for(url in count_url) print count_url[url],url;print "number of 404 errors: "count_404[404];}' log.txt

Answer 1