如何理解这个“TEX 连字模式组合”表?

如何理解这个“TEX 连字模式组合”表?

我对此感到困惑:http://tug.org/tex-hyphen/#languages

有“ en-gb ”,意思是“英国的英语”;有“ en-us ”,意思是“美国的英语”……但没有“澳大利亚的英语”或“爱尔兰的英语”。

有一种语言叫做“ga”,显然是“爱尔兰语”,但这种语言在任何地方都算“爱尔兰语”吗?“爱尔兰语”不是爱尔兰英语吗?那么,这是“en-GA”吗?为什么不这样叫呢?另外,根据维基百科,“ga”是加蓬的 TLD/国家代码。不是爱尔兰。

整个页面上没有任何地方提到“澳大利亚”。

我对整个页面感到很困惑。我试图确保我可以使用“英语 + 位置”的每种组合的连字符规则,最好是“语言 + 位置”,但似乎只有很少的组合……英语只有两种不同的组合?

我感觉我一定错过了一些重要的东西。

答案1

语言代码来自ISO 639;国家代码来自ISO 3166。我还没有发现是否有一个标准化的语言和国家组合列表。这里是一个来自翻译公司的清单,但我不知道这些组合是否在任何地方的标准中定义。

您会发现,除了常见的 en-us 和 en-gb 之外,还有 en-au、en-nz、en-in、en-ie 以及其他语言:听起来好像 TEX 只选择了其中的几个。

爱尔兰语(也叫盖尔语或爱尔兰语盖利格) 与爱尔兰英语完全不同。

编辑:语言和国家的组合似乎是(一部分)IETF 语言标签;但尽管那篇维基百科文章似乎指向了 IANA 的官方子标签列表,列表- 这是我在 IANA 资源中唯一能找到的 - 非常不完整,而且相当随机。(唯一恩-它包含的标签是恩卡en-GB-oeden-GB-oxendict恩邦炖汤)。

相关内容