为什么芬兰语连字符对于以“laus”开头的单词不起作用?

为什么芬兰语连字符对于以“laus”开头的单词不起作用?

启用芬兰语连字功能后,以“laus”开头的单词似乎在第一个可能的点处没有连字。以下是示例代码。

\documentclass{article}
\usepackage{fontspec}
\usepackage{polyglossia}
\usepackage{testhyphens}
\setmainlanguage{finnish}

\begin{document}

\begin{checkhyphens}
  lause lausua lausun lausutte lauta laukaus laulaa lauma Laura
\end{checkhyphens}

\end{document}

它打印这些内容:

lause
lausua
lausun
lausut-te
lau-ta
lau-kaus
lau-laa
lau-ma
Lau-ra

正常的芬兰语连字规则(Latex 之外)会将前四个单词像这样连字:lau-se、lau-sua、lau-sun、lau-sut-te。

答案1

正如您所发现的,相关模式是u2s覆盖模式1se,否则将允许连字 lau-se。芬兰语的模式大多实施简单的正字法规则,只有末尾的几个模式试图处理复合词(u2s后面还有 42 个)。它们肯定可以改进,因为它们已经有三十多年的历史了。在的情况下u2s,粗略地看一下单词列表就会发现,这种特定的抑制模式阻止了更多的好断词而不是坏断词;我想人们认为这比为了一些好断词而允许坏断词的替代方案要好,而且没有人有时间去改进模式。

如果您有时间,我们可以准备对当前模式进行更新。我还会联系原始模式作者,看看他是否有建议。

相关内容