如何迭代文件并计算每个字符出现的次数？

Question 1

我会选择这样的东西：

grep -o . file | sort | uniq -c

  1 d
  1 e
  1 H
  3 l
  2 o
  1 r
  1 W

或者如果您想将大写和小写字母视为单个字符：

grep -o . file | sort | uniq -ic | tr [:lower:] [:upper:]

  1 D
  1 E
  1 H
  3 L
  2 O
  1 R
  1 W

| tr [:lower:] [:upper:]可以选择将所有大写字母打印为您的预期输出。

Answer

我会选择这样的东西：

grep -o . file | sort | uniq -c

  1 d
  1 e
  1 H
  3 l
  2 o
  1 r
  1 W

或者如果您想将大写和小写字母视为单个字符：

grep -o . file | sort | uniq -ic | tr [:lower:] [:upper:]

  1 D
  1 E
  1 H
  3 L
  2 O
  1 R
  1 W

| tr [:lower:] [:upper:]可以选择将所有大写字母打印为您的预期输出。

Question 2

为了计算文件中的每个字符GNU awk

awk 'BEGIN{FS=""} {for (i=1; i<=NF; i++){a[$i]++}}END{for (i in a){print i,":", a[i]}}' file

对待字符不区分大小写tolower或者toupper可以使用

awk 'BEGIN{FS=""} {for (i=1; i<=NF; i++){a[tolower($i)]++}}END{for (i in a){print i,":", a[i]}}' file

样本输出

c : 1
d : 3
e : 2
f : 2
h : 1
i : 12
l : 1
m : 1
n : 8
o : 2
p : 1
r : 4
s : 1
t : 6
u : 2
{ : 3
} : 3

Answer

为了计算文件中的每个字符GNU awk

awk 'BEGIN{FS=""} {for (i=1; i<=NF; i++){a[$i]++}}END{for (i in a){print i,":", a[i]}}' file

对待字符不区分大小写tolower或者toupper可以使用

awk 'BEGIN{FS=""} {for (i=1; i<=NF; i++){a[tolower($i)]++}}END{for (i in a){print i,":", a[i]}}' file

样本输出

c : 1
d : 3
e : 2
f : 2
h : 1
i : 12
l : 1
m : 1
n : 8
o : 2
p : 1
r : 4
s : 1
t : 6
u : 2
{ : 3
} : 3

Question 3

虽然我更喜欢其他答案，但我错过了一个可移植的答案，因此使用任何 awk：

awk '
{
    m=1
    #$0=toupper($0)
    while(m<=length($0)){ #While there are still chars unparsed in the line
        ch=substr($0,m,1) #Get one char of the line
        cnt[ch]++         #Increment its counter
        m++               #Point to the next char
    }
}
END{for(ch in cnt)print cnt[ch],"\t",ch}
' file

取消注释行以使计数不区分大小写。

示例文件的输出：

Answer

虽然我更喜欢其他答案，但我错过了一个可移植的答案，因此使用任何 awk：

awk '
{
    m=1
    #$0=toupper($0)
    while(m<=length($0)){ #While there are still chars unparsed in the line
        ch=substr($0,m,1) #Get one char of the line
        cnt[ch]++         #Increment its counter
        m++               #Point to the next char
    }
}
END{for(ch in cnt)print cnt[ch],"\t",ch}
' file

取消注释行以使计数不区分大小写。

示例文件的输出：

如何迭代文件并计算每个字符出现的次数？

答案1

答案2

答案3

相关内容