我正在使用瑞典语词典在命令行中测试 hunspell。交互模式下的输入在拼写检查之前将所有特殊字符(例如 å ä ö)替换为空格。
Hunspell 1.3.2
sjögräs
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*
sj gr s
& sj 15 0: SJ, aj, dj, sk, s, j, sej, sju, sjö, sjå, sa, se, ej, st, si
& gr 15 3: ge, g, r, ger, gir, gro, gör, grå, går, gry, er, nr, dr, go, kr
*
如您所见,提示的编码正在起作用,在输入和输出中都显示 å ä 和 ö。
管道给出相同的结果:
echo sjögräs | hunspell -d sv_SE
我尝试为 hunspell 提供不同的选项,包括-i UTF-8
、-i UTF-16
以及保留 aff 文件的SET ISO8859-1
。但都不起作用。
法语也发生了同样的事情:
C:\Users\gauthier>echo résultat | hunspell -d fr-moderne
Hunspell 1.3.2
*
& sultat 2 2: sultan, rAcsultat
此外,输出还存在问题。
我在 MinGW 中编译了 hunspell,并将生成的所需文件移动到我的路径中的某个位置,但我认为这些信息不太相关。
如何让 hunspell 识别其输入中的特殊字符?