计算具有特定列数的行数

Question 1

Awk 非常适合这个。它将在空白处分割行（默认情况下；使用选项更改-F），并且内部变量NF（字段数）具有每行的字段数。因此，只需浏览该文件，保存NF每一行：

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

上面的代码只是将字段数 ( NF) 存储在关联数组中nums，该数组的键是字段数，值是在文件中找到列数的次数。最后，我们只需遍历数组并打印即可。在您的示例上运行上述结果将导致：

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

这种方法的一个（小）缺点是您需要在内存中为文件中的每一行保留一个条目。这不会是一个问题，除非你的文件绝对巨大或者你的可用内存非常少，但如果是这样，你可以通过打印出每行的字段数然后计数来解决这个问题：

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

或者，要获得相同的输出：

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Answer

Awk 非常适合这个。它将在空白处分割行（默认情况下；使用选项更改-F），并且内部变量NF（字段数）具有每行的字段数。因此，只需浏览该文件，保存NF每一行：

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

上面的代码只是将字段数 ( NF) 存储在关联数组中nums，该数组的键是字段数，值是在文件中找到列数的次数。最后，我们只需遍历数组并打印即可。在您的示例上运行上述结果将导致：

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

这种方法的一个（小）缺点是您需要在内存中为文件中的每一行保留一个条目。这不会是一个问题，除非你的文件绝对巨大或者你的可用内存非常少，但如果是这样，你可以通过打印出每行的字段数然后计数来解决这个问题：

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

或者，要获得相同的输出：

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Question 2

一个非awk解决方案，可能有点麻烦：

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

Answer

一个非awk解决方案，可能有点麻烦：

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

计算具有特定列数的行数

答案1

答案2

相关内容