如何找到目录中每个文件最常见的单词？

Question

我将使用grepwith-o仅打印匹配的字符串顶部提取单词：

$ for file in *; do 
    printf '%s : %s\n' "$(grep -Eo '[[:alnum:]]+' "$file" | sort | uniq -c | 
        sort -rn | head -n1)" "$file" 
done
      8 no : file1
     10 so : file2
     12 in : file3

或者，如果您grep不支持-o，您可以使用tr来替换所有空格和标点符号\n，过滤grep .以跳过空白行，然后进行计数：

$ for file in *; do 
    printf '%s : %s\n' "$(tr '[[:punct:]][[:space:]]' '\n' < "$file" | grep . | 
      sort | uniq -c | sort -rn | head -n1)" "$file" 
done
  8 no : file1
 10 so : file2
 12 in : file3

Answer 1

我将使用grepwith-o仅打印匹配的字符串顶部提取单词：

$ for file in *; do 
    printf '%s : %s\n' "$(grep -Eo '[[:alnum:]]+' "$file" | sort | uniq -c | 
        sort -rn | head -n1)" "$file" 
done
      8 no : file1
     10 so : file2
     12 in : file3

或者，如果您grep不支持-o，您可以使用tr来替换所有空格和标点符号\n，过滤grep .以跳过空白行，然后进行计数：

$ for file in *; do 
    printf '%s : %s\n' "$(tr '[[:punct:]][[:space:]]' '\n' < "$file" | grep . | 
      sort | uniq -c | sort -rn | head -n1)" "$file" 
done
  8 no : file1
 10 so : file2
 12 in : file3

如何找到目录中每个文件最常见的单词？

答案1

相关内容