为什么 uniq 忽略 Unicode 和只有一个字母的行？

Question

LC_COLLATE您只为命令设置cat（不使用它），而您需要为sort和设置它uniq。

另外，你可能需要设置LC_CTYPE为utf-8，否则会引起混乱。我会设置LC_ALL到en_US.UTF-8

uniq -u仅报告独特的行。所以，如果这些单字母单词都出现了好几次，它们不出现也是正常的。

在我的系统上，重剑确实出现两次：

$ cat american-english british-english | sort | grep -x 'épée'
épée
épée

也许你的意思是sort | uniq或sort -u。

Answer 1

LC_COLLATE您只为命令设置cat（不使用它），而您需要为sort和设置它uniq。

另外，你可能需要设置LC_CTYPE为utf-8，否则会引起混乱。我会设置LC_ALL到en_US.UTF-8

uniq -u仅报告独特的行。所以，如果这些单字母单词都出现了好几次，它们不出现也是正常的。

在我的系统上，重剑确实出现两次：

$ cat american-english british-english | sort | grep -x 'épée'
épée
épée

也许你的意思是sort | uniq或sort -u。

相关内容