将文本文件排列为每行一个单词

将文本文件排列为每行一个单词

我有一个包含大量文本的文本文件,我想将每个单词排序在其他单词下面,我该怎么做。对于前。

cat PDF | less
word one, word two. Word three ?

我需要他们

word
one
word
two
Word
three

答案1

这并不是我所说的排序。

您可以将所有非字母序列压缩并音译为换行符

tr -sc '[:alpha:]' '[\n*]' < PDF

或(至少使用 GNU grep)匹配并输出序列单词-o字符(字母、十进制数字和下划线),使用该选项每行一个

grep -o '\w*' PDF

相关内容