我需要一份全面的捷克语单词表。所谓全面,是指至少涵盖 70000 多个单词的列表(每行一个单词)。有没有办法将捷克语添加到 /usr/share/dict?我在 ubuntu 软件包安装程序上找不到任何资源(涵盖了其他语言,但没有捷克语),而且 Google 也没有帮助!
答案1
myspell 的捷克语词典 (myspell-cs) 和 GNU Aspell 的捷克语词典 (aspell-cs)可从当前所有支持的 Ubuntu 版本的默认存储库安装。要安装其中一个捷克语词典包,请运行sudo apt install myspell-cs
或sudo apt install aspell-cs
这里有 166,566 个捷克语单词的列表:https://raw.githubusercontent.com/titoBouzout/Dictionaries/master/Czech.dic。此列表仅包含单词,并不包括列表中单词的定义。
答案2
我也需要在整个捷克语词典中 grep 特定的单词,并使用aspell
包含 3.1M 个捷克语单词。
$apt install aspell aspell-cs
$aspell -d cs dump master | aspell -l cs expand | wc -l
3141344
$aspell -d cs dump master | aspell -l cs expand | egrep ".{30,}" | wc -l
110
这显示了长度超过 30 个字符的单词总数。你可以使用不同的 grep 模式来查找填字游戏中缺失的单词 :-)
来源: https://superuser.com/questions/137957/how-to-convert-aspell-dictionary-to-simple-list-of-words