为什么 TeX/LaTeX 没有针对更多语言变体的连字符模式?

为什么 TeX/LaTeX 没有针对更多语言变体的连字符模式?

页面位于http://tug.org/tex-hyphen/#languages列出可使用连字模式的“语言”(作为包hyph-utf8)。

我本来期望更多。例如,其他一些软件系统使用“en_US”、“en_UK”、“en_AU”、“en_CA”等“语言环境”。这里,在英语变体中,仅列出了英国和美国的英语,列出的语言使用破折号而不是下划线,并且全部小写。

为什么似乎存在的变体如此之少?

答案1

获得适当的资源来生成模式不仅仅是志愿者努力的问题。

美国和英国的模式均来自商业出版的词典。美国模式的来源在 Frank Liang 的论文中有所说明(该论文的副本可在 TUG 网站上找到),而英国模式则基于牛津迷你词典。在这两种情况下,都涉及大量谈判、保密协议等,耗时数年。有关英国模式更新版本的谈判仍在进行中;讨论始于两年多前,涉及同一词典出版商和制作原始模式的个人。

由于您正在制作杂志,您可能已经或能够与您所提到的英语地区的词典出版商建立联系。

生成模式所需的主要资源是嵌入连字符的可靠数据库。必须获得许可,这将需要保证(可能是合同)数据库不会用于其他任何用途或与他人共享。可能会有金钱方面的考虑,尽管我相信访问当前美国和英国模式所用的资源是免费协商的。必须剔除含糊不清的条目(例如,“pro-duce”(动词)与“prod-uce”(名词)),并应用 Liang 的论文中描述的其他编辑。

这不是一项适合胆小者进行的活动。

最后,除非区域连字符与现有的美国和英国用法有很大不同,否则这样的工作可能不会导致任何显著的差异,并且不值得付出的努力。

相关内容