我有一个包含大量文本的文本文件,我想将每个单词排序在其他单词下面,我该怎么做。对于前。
cat PDF | less
word one, word two. Word three ?
我需要他们
word
one
word
two
Word
three
答案1
这并不是我所说的排序。
您可以将所有非字母序列压缩并音译为换行符
tr -sc '[:alpha:]' '[\n*]' < PDF
或(至少使用 GNU grep)匹配并输出序列单词-o
字符(字母、十进制数字和下划线),使用该选项每行一个
grep -o '\w*' PDF