function count{
declare -a array
for((i=0; i<256;i++)); do
${array[$i]}=0
done
while read line_in; do
((line_num++))
...(Code Needed)
if [ $line_num == 100 ]; then
break
fi
done < "${path_in}"
(Code needed to print the counts)
如何通过迭代文件的每一行并计算某个字符出现的次数并将其打印出来来完成此功能?
给定一个文本文件,我想迭代该文件,对于每一行,我想计算每个 ASCll 字母出现的数量并将其存储在数组中。然后我将输出数组中的每个元素的计数。大写和小写的处理方式相同。
输入:
Hello
world
预期输出:
D:1
H:1
E:1
L:3
O:2
R:1
W:1
答案1
我会选择这样的东西:
grep -o . file | sort | uniq -c
1 d
1 e
1 H
3 l
2 o
1 r
1 W
或者如果您想将大写和小写字母视为单个字符:
grep -o . file | sort | uniq -ic | tr [:lower:] [:upper:]
1 D
1 E
1 H
3 L
2 O
1 R
1 W
| tr [:lower:] [:upper:]
可以选择将所有大写字母打印为您的预期输出。
答案2
为了计算文件中的每个字符GNU awk
awk 'BEGIN{FS=""} {for (i=1; i<=NF; i++){a[$i]++}}END{for (i in a){print i,":", a[i]}}' file
对待字符不区分大小写tolower
或者toupper
可以使用
awk 'BEGIN{FS=""} {for (i=1; i<=NF; i++){a[tolower($i)]++}}END{for (i in a){print i,":", a[i]}}' file
样本输出
c : 1
d : 3
e : 2
f : 2
h : 1
i : 12
l : 1
m : 1
n : 8
o : 2
p : 1
r : 4
s : 1
t : 6
u : 2
{ : 3
} : 3
答案3
虽然我更喜欢其他答案,但我错过了一个可移植的答案,因此使用任何 awk:
awk '
{
m=1
#$0=toupper($0)
while(m<=length($0)){ #While there are still chars unparsed in the line
ch=substr($0,m,1) #Get one char of the line
cnt[ch]++ #Increment its counter
m++ #Point to the next char
}
}
END{for(ch in cnt)print cnt[ch],"\t",ch}
' file
取消注释行以使计数不区分大小写。
示例文件的输出:
1 h
1 w
3 l
2 o
1 d
1 r
1 e