awk 如何用新行替换空格并同时删除空行？

Question 1

没有真正需要通过将空格更改为换行符等来预处理文本，尤其是如果您想将操作合并到单个awk脚本中。

$ awk '{ for (i=1; i<=NF; ++i) count[$i]++ } END { for (word in count) print count[word], word }' file
4 the
2 sunny
3 is
1 day

它会遍历每个以空格分隔的单词并对其进行计数。计数存储在count按单词索引的数组中。最后，输出计数和相应的单词。这将自动跳过空行，因为它们不包含单词。

如果您需要对此进行排序，请将其通过管道传输sort -n。

如果你使用 GNU awk，你可以使用它的asorti()函数在块中进行排序END：

END {
    n = asorti(count, c2, "@val_num_desc")
    for (i=1; i<=n; i++ )
        printf("%d %s %s\n", i, count[c2[i]], c2[i])
}

Answer

没有真正需要通过将空格更改为换行符等来预处理文本，尤其是如果您想将操作合并到单个awk脚本中。

$ awk '{ for (i=1; i<=NF; ++i) count[$i]++ } END { for (word in count) print count[word], word }' file
4 the
2 sunny
3 is
1 day

它会遍历每个以空格分隔的单词并对其进行计数。计数存储在count按单词索引的数组中。最后，输出计数和相应的单词。这将自动跳过空行，因为它们不包含单词。

如果您需要对此进行排序，请将其通过管道传输sort -n。

如果你使用 GNU awk，你可以使用它的asorti()函数在块中进行排序END：

END {
    n = asorti(count, c2, "@val_num_desc")
    for (i=1; i<=n; i++ )
        printf("%d %s %s\n", i, count[c2[i]], c2[i])
}

Question 2

@Kusalananda 已经提供了一个很好的 awk 解决方案，但也可以：

$ tr ' ' '\n' < file | sort | uniq -c
      1 day
      3 is
      2 sunny
      4 the

Answer

@Kusalananda 已经提供了一个很好的 awk 解决方案，但也可以：

$ tr ' ' '\n' < file | sort | uniq -c
      1 day
      3 is
      2 sunny
      4 the

Question 3

如果您有 GNU grep，则可以使用-o( --only-matching) 选项来显示每行一个匹配项：

grep -o '\S\+' words.txt

然后像以前一样通过管道传递到sort和uniq。

Answer

如果您有 GNU grep，则可以使用-o( --only-matching) 选项来显示每行一个匹配项：

grep -o '\S\+' words.txt

然后像以前一样通过管道传递到sort和uniq。

相关内容