如何计算文件中重复的数字，然后按重复顺序排列它们？

Question 1

你可以做：

tr -s ' ' <file.txt | tr ' ' '\n' | sort -n | uniq -c | sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/'

tr -s ' '将使连续的空间合并为一个
tr ' ' '\n'将空格转换为换行符
sort -n将进行数字sort运算
uniq -c会做计数
sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/'将按照您想要的方式格式化输出。

例子：

$ tr -s ' ' <file.txt | tr ' ' '\n' | sort -n | uniq -c | sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/'
12=44
12=22
10=32
8=43
7=20
6=33
6=29
6=26
6=19
6=18
6=17
6=13
6=8
6=6
5=40
5=38
5=31
5=27
5=24
5=23
5=9
5=5
5=3
4=42
4=37
4=36
4=35
4=28
4=21
4=16
4=14
4=12
4=11
3=45
3=39
3=34
3=10
3=2
3=1
2=41
2=25
2=15
2=7
2=4

Answer

你可以做：

tr -s ' ' <file.txt | tr ' ' '\n' | sort -n | uniq -c | sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/'

tr -s ' '将使连续的空间合并为一个
tr ' ' '\n'将空格转换为换行符
sort -n将进行数字sort运算
uniq -c会做计数
sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/'将按照您想要的方式格式化输出。

例子：

$ tr -s ' ' <file.txt | tr ' ' '\n' | sort -n | uniq -c | sort -k1,1rn -k2,2rn | sed 's/^ \+//; s/ /=/'
12=44
12=22
10=32
8=43
7=20
6=33
6=29
6=26
6=19
6=18
6=17
6=13
6=8
6=6
5=40
5=38
5=31
5=27
5=24
5=23
5=9
5=5
5=3
4=42
4=37
4=36
4=35
4=28
4=21
4=16
4=14
4=12
4=11
3=45
3=39
3=34
3=10
3=2
3=1
2=41
2=25
2=15
2=7
2=4

Question 2

这将计算某个数字出现的次数，并按出现次数降序排列：

$ awk '{for (i=1;i<=NF;i++) a[$i]++;} END{for (i in a)print i"="a[i]}' file | sort -rnt= -k2,2
44=12
22=12
32=10
43=8
20=7
8=6
6=6
33=6
29=6
26=6
19=6
18=6
17=6
13=6
[...snip...]

其中，44=12表示44重复了12多次。

GNU awk

如果您安装了 GNU awk (gawk)，则可以省去使用管道的麻烦，只需一个 awk 语句即可完成所有操作：

awk 'BEGIN{PROCINFO["sorted_in"]="@val_num_desc"} {for (i=1;i<=NF;i++) a[$i]++;} END{for (i in a)print i"="a[i]}' file

Answer

这将计算某个数字出现的次数，并按出现次数降序排列：

$ awk '{for (i=1;i<=NF;i++) a[$i]++;} END{for (i in a)print i"="a[i]}' file | sort -rnt= -k2,2
44=12
22=12
32=10
43=8
20=7
8=6
6=6
33=6
29=6
26=6
19=6
18=6
17=6
13=6
[...snip...]

其中，44=12表示44重复了12多次。

GNU awk

如果您安装了 GNU awk (gawk)，则可以省去使用管道的麻烦，只需一个 awk 语句即可完成所有操作：

awk 'BEGIN{PROCINFO["sorted_in"]="@val_num_desc"} {for (i=1;i<=NF;i++) a[$i]++;} END{for (i in a)print i"="a[i]}' file

Question 3

这只是 AWK 的变体（我已经很久没用过 AWK 了……）

awk -v RS="[ \n]+" '{a[$1]++} END{ for(b in a){print b,a[b] | "sort -rnk2,2"}}'

Answer

这只是 AWK 的变体（我已经很久没用过 AWK 了……）

awk -v RS="[ \n]+" '{a[$1]++} END{ for(b in a){print b,a[b] | "sort -rnk2,2"}}'

如何计算文件中重复的数字，然后按重复顺序排列它们？

答案1

答案2

GNU awk

答案3

相关内容