中型英语单词表

中型英语单词表

我正在尝试编写一个具有拼写检查/自动完成功能的程序。为此,我需要一个大小合适的最常见英语单词列表。我遇到的问题是,我发现的列表大小差异很大。它们要么少于 1,000 个单词,要么超过 50,000 个单词。少于 1,000 个单词的列表太短,并且会省略许多有用的单词。但是,超过 50,000 个单词的列表对我的算法来说有点太多了(速度方面)。

有谁知道一个大约 3,000-12,000 个英文单词的列表。最好是 .txt 文件。此外,它需要具有相对不受限制的许可证(即可重新分发)。

答案1

尝试维基词典中最常用的英语单词列表。想拿多少就拿多少!

答案2

http://wordlist.sourceforge.net/有一个单词列表。我通常认为添加更多单词根本不会占用大量计算资源(因为最坏的情况是单词列表的长度与比较次数相同,如果您使用字典或其他优化的数据结构,则速度可能会更快)。

答案3

http://www.gnu.org/software/miscfiles/文件中有一个单词列表

$ wc -w words extra.words 
  234937 words
  121847 extra.words
  356784 total

数字永远不会说谎....

相关内容