单词表来源

单词表来源

我正在寻找几种语言的名词、副词、形容词和动词的来源。

我希望这些列表已经被分开,而不必经过牛津英语辞典(以及非英语对应词)通过手动重新创建所述列表。

我不太关心定义,我知道有些词可以是多个词类 - 这很好 - 像“many”这样的词可以是名词或形容词,并且可以出现在两个列表中。

这里有没有人知道这样的来源?如果没有,有人能给我指出正确的方向吗?

我可以接受以下任何一种格式(或者如果大家有想法的话也可以采用类似的格式):

  • 文件名:<word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
  • 纯文本文件,如“名词”、“动词”等
  • mysql 表
  • ETC

答案1

我用过词网来自普林斯顿大学的一些项目。这是一个英语词汇数据库。全球词汇网络是该项目的一个扩展,旨在尝试对所有语言执行相同的操作。

您可能还对以下相关项目感兴趣http://wordnet.princeton.edu/wordnet/related-projects/

答案2

这可能根本没用,我不知道。但是 MediaWiki 有一个api用于列出属于某一类别的所有页面。您可以在 Wiktionary.org 上尝试使用它。

笔记:

  • 每个查询仅返回 500 个结果。但是,最后还指定了一个参数,用于另一个查询以获取接下来的 500 个结果。
  • 它包括指定类别中的所有内容,甚至其他子类别。
  • 结果似乎是按字母顺序排列的,但以大写字母开头的所有内容都排在小写字母之前。

例子:

希望这会有所帮助,这是我能想到的。

答案3

我赞同@teknikqa 对 wordnet 的建议,但我建议您查看他们的 API;

讲故事的时间:我有一门人工智能课程,其中有一个语言分析部分;我使用 wordnet 的 perl API 自动查找前三种定义类型,并近乎实时地对短语进行分类 故事结束

有 API 可用于多种语言

仅供参考:该项目获得了 A+

相关内容