是否有一个工具可以检测几段文本的语言?
答案1
有很多工具可以做到这一点,我能想到的第一个工具是谷歌自己的: http://code.google.com/apis/ajax/playground/#language_detect
- 在 Java 中,有http://textcat.sourceforge.net/
- 在 Ruby 中https://github.com/peterc/whatlanguage
- 在 Perl 中http://search.cpan.org/~ambs/Lingua-Identify-0.29/lib/Lingua/Identify.pm ETC。
希望能帮助到你
答案2
该file
工具有一系列用于猜测文件类型的启发式方法,其中包括一个报告“英文文本”的方法。我不知道它是否知道其他人类语言,但它肯定可以升级到猜测它们之间的语言。