我正在寻找几种语言的名词、副词、形容词和动词的来源。
我希望这些列表已经被分开,而不必经过牛津英语辞典(以及非英语对应词)通过手动重新创建所述列表。
我不太关心定义,我知道有些词可以是多个词类 - 这很好 - 像“many”这样的词可以是名词或形容词,并且可以出现在两个列表中。
这里有没有人知道这样的来源?如果没有,有人能给我指出正确的方向吗?
我可以接受以下任何一种格式(或者如果大家有想法的话也可以采用类似的格式):
- 文件名:
<word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
- 纯文本文件,如“名词”、“动词”等
- mysql 表
- ETC
答案1
我用过词网来自普林斯顿大学的一些项目。这是一个英语词汇数据库。全球词汇网络是该项目的一个扩展,旨在尝试对所有语言执行相同的操作。
您可能还对以下相关项目感兴趣http://wordnet.princeton.edu/wordnet/related-projects/
答案2
这可能根本没用,我不知道。但是 MediaWiki 有一个api用于列出属于某一类别的所有页面。您可以在 Wiktionary.org 上尝试使用它。
笔记:
- 每个查询仅返回 500 个结果。但是,最后还指定了一个参数,用于另一个查询以获取接下来的 500 个结果。
- 它包括指定类别中的所有内容,甚至其他子类别。
- 结果似乎是按字母顺序排列的,但以大写字母开头的所有内容都排在小写字母之前。
例子:
希望这会有所帮助,这是我能想到的。
答案3
我赞同@teknikqa 对 wordnet 的建议,但我建议您查看他们的 API;
讲故事的时间:我有一门人工智能课程,其中有一个语言分析部分;我使用 wordnet 的 perl API 自动查找前三种定义类型,并近乎实时地对短语进行分类 故事结束
有 API 可用于多种语言
仅供参考:该项目获得了 A+