每种语言中每个单词的列表(或获取方法)

每种语言中每个单词的列表(或获取方法)

我正在寻找一份包含所有语言(包括俚语)的单词表。有这么庞大的列表吗?

我知道最好的办法是先获取/usr/share/dict/words每种语言的,然后再填写俚语(词典/单词中没有俚语),但我不知道如何下载这些文件。也不知道从哪里获取俚语。

我看到了维基词典有很多我需要的东西,但没有俚语。另外,我还没有准备好编写一些脚本来浏览该网站。

[编辑] 仍然需要这个 2019。这是一个来源。 https://github.com/dwyl/english-words

答案1

不确定其他语言,但你应该看看英语开放词汇表首先:

EOWL 目前包含大约 128,985 个单词。为了使 EOWL 更适合用于计算机单词游戏,所有长度超过 10 个字母的单词都从 UKACD 源列表中删除,并且所有专有名词和需要变音符号、连字符和撇号的单词都被删除。这使得它与标准 ENABLE 单词列表非常相似,但 EOWL 略小(大约 44,000 个单词),因为它不包含长度超过 10 个字符的单词。

另外,看看SCOWL(拼写检查导向单词列表)及其朋友

SCOWL(面向拼写检查器的单词列表)和 Friends 是一个英语单词信息数据库,可用于创建适合大多数英语方言拼写检查器的高质量单词列表。该数据库主要包含单词的常见程度、英语方言之间的拼写差异、拼写变体信息以及(基本)词性和词形变化信息。

相关内容