我使用 lualatex,但我相信这适用于任何 *tex。我将问题缩小到拉丁语系语言,这样我们就不必处理特殊的首字母/尾字母形式、必需的连字符等等。这适用于任何一般文档类中的文本(而非数学)。
命令\lefthyphenmin
和\righthyphenmin
接受一个整数,即当单词用连字符连接时,行尾/行首的最小字符数。软件包babel
和polyglossia
加载每个选定语言的默认设置。用户可以手动更改这些值。
现在回答我的问题:连字符规则是否忽略了单词上附加的任何标点符号(或其他非字母符号)?例如:scarequotes
versus“scarequotes”
在句子中间使用。假设允许使用连字符,我希望两个单词都使用相同的连字符(或不使用),即使一个单词附加了引号,而另一个单词没有。换句话说,我不希望引号计入连字符。
我可以用随机文本进行实验,但也许这是众所周知的事情?尤其是法语,加上标点符号间距,会有所不同吗?
编辑(根据评论):如果语言将某物视为字母,那么在这种情况下,我打算将其视为字母。例如,英语单词将wouldn't
撇号视为字母(我希望如此)。我预计,在单词开头或结尾使用撇号或类似符号的语言中,它将是字母。