Linux - 计算超过一定字符长度的单词

Linux - 计算超过一定字符长度的单词

我想知道如何计算 .txt 文件中超过 5 个字符的单词数,使用埃格雷普厕所。请说清楚,因为我是 Linux 新手。

答案1

在你提到你的教授之后,我有点担心我们正在为你做作业,但你可以尝试:

egrep -wo '[[:alnum:]]{5,}' filename.txt | wc -w 

这将在形成单词 ( -w) 的行中查找 5 个或更多字母数字字符的范围,仅打印匹配项,每个匹配项在其自己的行 ( -o) 上,然后使用 对其进行计数wc -w。 (wc -l在这种情况下也适用)。

更改[[:alnum:]][[:alpha:]]如果只计算字母。

如果出于某种原因您只想使用egrep,您可以调用它两次,并让第二次计算其中包含任何内容的行。

egrep -wo '[[:alnum:]]{5,}' filename.txt | egrep -c '.'

相关内容